hadoop格式化_hadoop格式化hdfs命令

2024-11-10 09:55 读书笔记

hbase创建表时出现connection closed错误

这样目录就变成/usr/local/hadoop

解决方法如下：

hadoop格式化_hadoop格式化hdfs命令

当我们频繁的在一台机器A上连接另外一台机器B时，不论是文件还是删除文件，或者是进行其他作。那么都要使用机器B的用户名和密码。每次都需要输入密码，那么效率降低了。这个时候，如果可以不输入密码，还有一定的安全性，可以防止黑客在中间截取信息。那么就需要一种安全认证技术。

先关闭hbase和hadoop进程

（14）movefromLocal命令

查看hdfs-site.xml

把这两个文件夹中的文件全部删除（name文件夹同理）

重新执行hadoop格式化

HBase是一个分布式的、面向列的开源数据库，该技术来源于 Fay Chang 所撰写的Google论文“Bigtable：一个结构化数据的分布式存储系统”。就像Bigtable利用了Google文件系统（File System）所提供的分布式数据存储一样，HBase在Hadoop之上提供了类似于Bigtable的能力。HBase是Apache的Hadoop项目的子项目。HBase不同于一般的关系数据库，它是一个适合于非结构化数据存储的数据库。另一个不同的是HBase基于列的而不是基于行的模式。

hadoop在Linux下的简单配置

将文件从源路径移动到目标路径。这个命令允许有多个源路径，此时目标路径必须是一个目录

实际生产环境中，员工不会直接登陆，而是通过远程连接工具，进行远程登陆。那么就需要知道的IP地址，一个用户名和密码。

1）安装(略)

2）连接虚拟机（前提是物理机能ping通虚拟机）

1）准备工作

3）原理

[上传失败...(image-3835b9-1576065751546)]

1）说明

1）准备工作

2）解压jdk到/opt/apps/

4）配置环境变量

hadoop namenode -format4.1）说明

4.2）配置

4.3）使当前窗口生效（或者reboot）

4.4）验证2）测试

1）解压缩

2）更名

3）配置

4）使当前窗口生效

5）验证

1）守护进程布局

2）配置文件的说明

1）配置core-site.xml

2）hdfs-site.xml

3）mapred-site.xml

5）sles文件：配置所有datanode的主机名

6）hadoop-env.sh

1）说明，使用完整克隆，克隆mar

2）克隆步骤

3）修改新克隆机器的主机名

4）修改新克隆机器的IP地址

5）重启后，验证免密登陆认证是否有效

1）目的

注意：一定要选择namenode所在的上进行格式化

1）开启集群的命令

2）使用jps查看上的守护进程

3）使用协议查看分布式文件系统

5）解决不正常的方式

3.1 常用指令：

4.1.1 解压hadoop-2.7.6.tar.gz到本地磁盘，如下图：

4.1.2 配置环境变量

4.1.3 由于Hadoop是在32位系统上编译的，并且对windows支持不好，所以需要把64的编译本地库文件(下图的两个文件)，放入bin目录中。

10.1.4 验证环境变量是否生效：

为了方便开发，我们可以将相关的jar提取出来。

如何搭建基于Hadoop的大数据平台

2）格式化的命令

Hadoop中有很多方法可以加入多个数据集。MapReduce提供了Map端和Reduce端的数据连接。这些连接是非平凡的连接，并且可能会是非常昂贵的作。Pig和Hive也具有同等的能力来申请连接到多个数据集。Pig提供了连接，合并连接和倾斜连接（skewed join），并且Hive提供了map端的连接和完整外部连接来分析数据。

（7）du命令

一个重要的事实是，通过使用各种工具，比如MapReduce、Pig和Hive等，数据可以基于它们的内置功能和实际需求来使用它们。至于在Hadoop分析大量数据，Anoop指出，通常，在大数据/Hadoop的世界，一些问题可能并不复杂，并且解决方案也是直截了当的，但面临的挑战是数据量。在这种情况下需要不同的解决办法来解决问题。

4）yarn-site.xml

一些分析任务是从日志文件中统计明确的ID的数目、在特定的日期范围内改造存储的数据、以及网友排名等。所有这些任务都可以通过Hadoop中的多种工具和技术如MapReduce、Hive、Pig、Giraph和Mahout等来解决。这些工具在自定义例程的帮助下可以灵活地扩展它们的能力。

HDFS作命令

source hadoop-env.sh

HDFS命令基本格式：hadoop fs -cmd < args >执行./stop-all.sh关闭集群,删除存放hdfs数据块的文件夹(hadoop/tmp/)，然后重建该文件夹,删除hadoop下的日志文件logs,执行hadoopnamenode-format格式化hadoop,重启hadoop集群

SecureCRT，可以通过ssh远程访问linux虚拟机。

表格：

注意：以上表格中路径包括hdfs中的路径和linux中的路径。对于容易产生歧义的地方，会特别指出“linux路径”或者“hdfs路径”。如果没有明确指出，意味着是hdfs路径。

HDFS有一个默认的工作目录/user/$USER，其中$USER是用户的登录用户名。不过目录不会自动建立，需要mkdir建立它

命令格式：hadoop fs -mkdir

注意：支持级联创建新目录，Hadoop的mkdir命令会自动创建父目录，类似于带-p的linux命令

put命令从本地文件系统中单个或多个源路径到目标文件系统，也支持从标准输入设备中读取输入并写入目标文件系统。分为本地上传和上传到HDFS中。

命令格式：hadoop fs -put filename

一个参数是句点，相当于放入了默认的工作目录，等价于 hadoop fs -put example.txt /user/chen

上传文件时，文件首先到DataNode上，只有所有的DataNode都成功接收完数据，文件上传才是成功的。

从本地文件系统中单个或多个源路径到目标文件系统。也支持从标准输入中读取输入写入目标文件系统。

采用-ls命令列出HDFS上的文件。在HDFS中未带参数的-ls命令没有返回任何值，它默认返回HDFS的home目录下

命令格式：user@NameNode:hadoop$ bin/hadoop dfs -ls

如：

通过“-ls 文件夹名” 命令浏览HDFS下文件夹中的文件

命令格式：hadoop dfs -ls 文件夹名

通过该命令可以查看in文件夹中的所有文档文件

通过“-cat 文件名”命令查看HDFS下文件夹中某个文件的内容

命令格式：hadoop$ bin/hadoop dfs -cat 文件名

通过这个命令可以查看in文件夹中所有文件的内容

通过“-get 文件按1 文件2”命令将HDFS中某目录下的文件到本地系统的某文件中，并对该文件重新命名。

命令格式：hadoop dfs -get 文件名新文件名

-get 命令与-put命令一样，既可以作目录，也可以作文件

通过“-rmr 文件”命令删除HDFS下的文件

-rmr 删除文档命令相当于delete的递归版本。

通过-format命令实现HDFS格式化

命令格式：user@NameNode:hadoop$ bin/hadoop NameNode -format

命令格式：user@NameNode:hadoop$ bin/ start-dfs.sh

当需要退出HDFS时，通过stop-dfs.sh 就可以关闭HDFS

命令格式：user@NameNode:hadoop$ bin/ stop-dfs.sh

（1）chgrp改变文件所属的组命令

chgrp命令的用途是：更改文件或目录的组所有权。

语法格式：hadoop fs -charg [-R] GROUP URL .....

使用-R将使改变在目录结构下递归进行。命令的使用者必须是文件的所有者或者超级用户。

（2）chmod改变文件的权限

chmod用于改变文件或目录的访问权限，这个Linux系统最常用的命令之一。

使用方法：hadoop fs -chmod [-R] ...

使用-R将使改变在目录结构下递归进行。命令的使用者必须是文件的所有者或者是超级用户

（3）chown改变文件的拥有者

chown命令改变文件的拥有者。

使用方法：hadoop fs -chown [-R]....

使用-R将使改变在目录结构下递归进行。命令的使用者必须是超级用户。

（4）copyFromLocal命令

除了限定源路径是只能是一个本地文件外，其他方面和put命令相似。

使用方法：hadoop fs -copyFromLocal URI

（5）copyToLocal命令

除了限定目标路径是一个本地文件外，其他方面和get命令类似。

使用方法：hadoop fs -copyToLocal {-ignorecrc} {-crc} URI

（6）cp命令

cp命令是将文件从源路径到目标路径。这个命令允许有多个源路径，此时目标路径必须是一个目录。

使用方法：hadoop fs -cp URI [URI....]

du命令显示目录中所有文件的大小，或者当只指定一个文件时，显示此文件的大小

使用方法：hadoop fs -du URI [URI........]

返回值

（8）dus命令

dus是显示文件大小的命令。

使用方法：hadoop fs -dus

（9）expunge命令

expunge是清空回收站的命令

使用方法：hadoop fs -expunge

（10）get命令

get是文件到本地文件系统的命令

使用方法：hadoop fs -get [-ignorecrc] [-crc]

返回值

（11）getmerge命令

getmerge命令用于接受一个源目录和一个目标文件作为输入，并且将源目录中所有的文件合并成本地目标文件。

使用方法：hadoop fs -getmerge [addnl]

参数说明：addl是可选的，用于指定在每个文件结尾添加一个换行符；

设在你的hdfs集群上有一个/user/hadoop/output目录

里面有作业执行的结果（多个文件组成）part-000000,part-000001,part-000002

然后就可以在本地使用vi local_file查看内容了

（12）ls命令

ls命令查看当前目录下的信息

使用方法：hadoop fs -ls

如果是文件，则按照如下格式返回文件信息：

文件名 <副本数>文件大小修改日期修改时间权限用户ID 组ID

如果是目录，则返回它直接子文件的一个列表，就像在UNIX中一样。目录返回i额表的信息如下：

目录名

修改日期修改时间权限用户ID 组ID

返回值

（13）lsr命令

lsr命令是-ls命令的递归版，类似于UNIX中的ls-r。

使用方法：hadoop fs -lsr

一份本地文件到hdfs，当成功后，删除本地文件

使用方法：dfs -moveFromLocal

（14.5）moveToLocal命令

类似于-get，但是当完成后，会删除hdfs上的文件

使用方法：moveToLocal

（15）mv命令

使用方法：hadoop fs -mv URI [URI.....]

备注：不允许在不同的文件系统间移动文件。

返回值

（16）put 命令

put命令从本地文件系统中单个或多个源路径到目标文件系统，也支持从标准输入中读取输入写入目标文件系统

使用方法：hadoop fs -put ....

（17）rm命令

rm命令删除指定的文件，只删除非空目录和文件。

使用方法：hadoop fs -rm URI [URI......]

请参考rmr命令了解递归删除。

（18）rmr命令

rmr命令是delete命令的递归版本

使用方法：hadoop fs -rmr URI [URI.......]

返回值

（19）setrep命令

使用方法：hadoop fs -setrep [-R]

参数说明：-R 选项用于递归改变目录下所有文件的副本系数

返回值

（20）stat命令

stat命令用于返回指定路径的统计信息

使用方法：hadoop fs -stat URI [URI......]

返回值

（21）tail命令

tail命令将文件尾部1KB的内容输出到stdout。支持-f选项，行为和UNIX中一致

使用方法：hadoop fs -tail [-f] URI

返回值

（22）test命令

test命令是检查命令，可以检查文件是否存在、文件的大小等。

使用方法：hadoop fs -test -[ezd] URI

（23）text命令

text命令用于将源文件输出问文本格式

使用方法：hadoop fs -text

允许的格式是zip和TextRecordInputStream。

（24）touchz 命令

touchz命令用于创建一个0字节的空文件。

使用方法： hadoop fs -touchz URI [URI....]

返回值

如何配置Hadoop环境

命令格式：hadoop$ bin/hadoop dfs -rmr 文件

用于测试，我用4台虚拟机搭建成了hadoop结构

我用了两个台式机。一个xp系统，一个win7系统。每台电脑装两个虚拟机，要不然内存就满了。

1、安装虚拟机环境

Vmware，收费产品，占内存较大。

或Oracle的VirtualBox，开源产品，占内存较小，但安装ubuntu过程中，重启会出错。

我选Vmware。

2、安装作系统

Centos，红帽开源版，接近于生产环境。

Ubuntu，作简单，方便，界面友好。

我选Ubuntu12.10.X 32位

3、安装一些常用的软件

在每台linux虚拟机上，安装：vim，ssh

sudo apt-get install vim

在客户端，也就是win7上，安装SecureCRT，Winscp或putty，这几个程序，都是依靠ssh服务来作的，所以前提必须安装ssh服务。

serv ssh status 查看ssh状态。如果关闭使用serv ssh start开启服务。

winSCP或putty，可以从win7向linux上传文件。

4、修改主机名和网络配置

主机名分别为：，host2，host3，host4。

sudo vim /etc/hostname

网络配置，包括ip地址，子网掩码，DNS。如上图所示。

5、修改/etc/hosts文件。

修改每台电脑的hosts文件。

hosts文件和windows上的功能是一样的。存储主机名和ip地址的映射。

在每台linux上，sudo vim /etc/hosts 编写hosts文件。将主机名和ip地址的映射填写进去。编辑完后，结果如下：

6、配置ssh，实现无密码登陆

无密码登陆，效果也就是在上，通过 ssh host2 或 ssh host3 或 ssh host4 就可以登陆到对方计算机上。而且不用输入密码。

四台虚拟机上，使用 ssh-keygen -t rsa 一路按回车就行了。

刚才都作甚了呢？主要是设置ssh的密钥和密钥的存放路径。路径为~/.ssh下。

打开~/.ssh 下面有三个文件

id_rsa，私钥

id_rsa.pub，公钥三个文件。

下面就是关键的地方了，（我们要做ssh认证。进行下面作前，可以先搜关于认证和加密区别以及各自的过程。）

①在上将公钥放到authorized_keys里。命令：sudo cat id_rsa.pub >> authorized_keys

②将上的authorized_keys放到其他linux的~/.ssh目录下。

命令：sudo scp authorized_keys hadoop@10.10.11.192:~/.ssh

sudo scp authorized_keys 远程主机用户名@远程主机名或ip:存放路径。

③修改authorized_keys权限，命令：chmod 644 authorized_keys

④测试是否成功

ssh host2 输入用户名密码，然后退出，再次ssh host2不用密码，直接进入系统。这就表示成功了。

7、上传jdk，并配置环境变量。

通过winSCP将文件上传到linux中。将文件放到/usr/lib/ja中，四个linux都要作。

解压缩：tar -zxvf jdk1.7.0_21.tar

设置环境变量 sudo vim ~/.bashrc

export JAVA_HOME = /usr/lib/ja/jdk1.7.0_21

export PATH = $JAVA_HOME/bin:$PATH

修改完后，用source ~/.bashrc让配置文件生效。

8、上传hadoop，配置hadoop

通过winSCP，上传hadoop，到/usr/local/下，解压缩tar -zxvf hadoop1.2.1.tar

再重命名一下，sudo mv hadoop1.2.1 hadoop

①修改环境变量，将hadoop加进去（四个linux都作一次）

sudo vim ~/.bashrc

export HADOOP_HOME = /usr/local/hadoop

export PATH = $JAVA_HOme/bin:$HADOOP_HOME/bin:$PATH

修改完后，用source ~/.bashrc让配置文件生效。

②修改/usr/local/hadoop/conf下配置文件

hadoop-env.sh，

（上面这张，有一些问题，只export JAVA_HOME进去就可以了，不用export HADOOP_HOME和PATH了）

core-site.xml，

hdfs-site.xml，

可用-ignorecrc选项CRC校验失败的文件：使用-CRC选项文件以及CRC信息。mapred-site.xml，

，

sl10.1.5 如果报错:Error: JAVA_HOME is incorrectly sete，

上面的hadoop-env.sh，core-site.xml，mapred-site.xml，hdfs-site.xml，，sle几个文件，在四台linux中都是一样的。

配置完一台电脑后，可以将hadoop包，直接拷贝到其他电脑上。

③要记得，将hadoop的用户加进去，命令为

sudo chown -R hadoop:hadoop hadoop

sudo chown -R 用户名@用户组目录名

④让hadoop配置生效

⑤格式化namenode，只格式一次

⑥启动hadoop

切到/usr/local/hadoop/bin目录下，执行 start-all.sh启动所有程序

⑦查看进程，是否启动

jps

，

host2，

host3，host4，的显示结果，与host2相同。

HADOOP 装好并格式化后，执行 hadoop fs -ls / 很长时间没反应，是怎么回事啊！

返回值：成功返回0 ，失败返回-1

如果你的命令，确实列出了相应的目录文件，那么这种情况确实7）yarn-env.sh挺少见的，有两种情况：

成功返回0，失败返回-1

2、你的网络或硬件配置太低，这种情况下的可情性不大

我的反应情况挺快的，也有可能是你的配置有问题，实在解决不了的话，建议你重布一下，可参考一下我的百度博客中，写了两篇这个内容。

如何恢复hadoop中被删除的文件

在搭建HDFS的完全分布式集群时，需要以下环境要求:

只删除, 没有清空回收站.

这咱情况比较简单, 有一点电脑知识的朋友都知道, 文件还是存在的, 只不过躺在回收站而已. 只要到回收站把文件找出来拖回或还原就行了.

2）配置域名映射2. 删除文件后还清空了回收站

很多朋友碰到的就是这种情况，也是我们主要这中恢复误删文件的恢复. 清空了回收站（或直接删除而根本不放入回收站）, 在我们眼里,好还文件已经消失了。其实文件还是在磁盘中的，只要你的电脑磁盘的其它作，一般来说文件都可以找回来。通过修改注册表就可以了.

先在"运行中"输入regedit 打开注册表, 找到分支 HKEY_LOCAL_MACHIME/SOFTWARE/microsoft/WINDOWS/CURRENTVERSION /EXPLORER/DESKTOP/NemeSpace

3. 删除文件后进行了磁盘作或格式化.

如果是这种误删文件的情况, 就不敢保证能完全成恢复文件. 这可以借助一些专门的软件来完成. 这里EasyRecovery.

EasyRecovery 一款威力非常强大的硬盘数据恢复工具。能够帮你恢复丢setrep命令可以改变一个文件的副本系数。失的数据以及重建文件系统。EasyRecovery 不会向你的原始驱动器写入任何东东，它主要是在内存中重建文件分区表使数据能够安全地传输到其他驱动器中。你可以从被破坏或是已经格式化的硬盘中恢复数据。该软件可以恢复大于 8.4GB 的硬盘。支持长文件名。被破坏的硬盘中像丢失的记录、BIOS 参数数据块；分区表；FAT 表；区都可以由它来进行恢复。

列举一种关闭hadoop01的方法

在左边空白处点击“新建”，选择“主键”，命名为“645FFO40—5081—101B—9F08—00AA002F954E”，再把右边的“默认”主键的键值设为“回收站”，退出注册表。再重启电脑即可见到被你删除的文件。

关闭安全authorized_keys，已认证的keys模式

NameNode在启动时会自动进入安全模式。安全模式是NameNode的一种状态，在这个阶段，文件系统不允许有任何修改。系统显示Namenodeinsafemode，说明系统正处于安全模式，这时只需要等待十几秒即可，也可通过下面的命令退出安全模式：$HADOOP_HOME/in/hadoopdfsadmin-safemodelee

直接启动或者关闭所有的进程（不，由于分布式下，namenode和d在最下面添加：atanode分布在不同机器上，启动的进程不相同）

用NameNode的~/dfs/name/current/VERSION中的namenode的clusterID替换所有datanode机器中~/dfs/data/current/VERSION中的clusterID。重启启动hadoop:start-all.sh.这种方式不影响现有的数据，避免了重新的格式化。

Hadoop,用了jps后只有jps一个进程，之前格式化了两次，但是已经删包重装了，现在该怎么解决呢？

通过运行start-dfs.sh，就可以启动HDFS了

commandnotfound指的是，你没有把HADOOP_HOME放到.bashrc这个文件中，就像windows下的环境变量一样。当然你也可以进到hadoop安装的目录下的bin，目录下执行hadoop。

1、你的"/"的文件太多了。

模式是结构主义用语。指用来说明事物结构的主观理性形式。法国莱维-施特劳斯认为科学的研究方法可以分为还原主义的或结构主义的。还原主义的方法是把复杂的现象还原到以简单的现象来说明，如生命现象可以还原到以物理化学过程来说明。而复杂的现象只能用结构主义的模式法说明。

命令格式：hadoop dfs put filename newfilename

模式有的是在以前经验中形成，有的是面对现象时立即形成。模式是否与现象的本质相合，则必须在认识过程中逐渐检验和修改，以便逐渐得到正确的认识。

结构主义的理论认为结构带有整体性，结构的一个成分变化会引起其他成分的变化，因而认识结构的模式必须有一系列的转换形式，后者必须是可以预测的，以便采取一种可以正确说明结构的模式。这一概念与皮亚杰心理学中的图式概念有类似的含义。

HADOOP 装好并格式化后，执行 hadoop fs -ls 显示 `.': No such file or directory

，突然发现脱离hadoop一段时间原来信手拈来的东西已经忘记得七七八八的内容。在HDFS中，没有当前工作目录这样一个概念，也没有cmd这样的命令。了，但是你这个问题还是很好解释的，首先，hadoop 3）更名作fs -ls 少了一个参数，应该要写成: hadoop fs -ls [你想要显示的路径] sudo apt-get install ssh，比如 hadoop fs -ls /root

hadoop安装问题

HDFS的命令远不止这些，对于其他作，可以通过- commandName 命令列出清单。下面列举一些命令进行说明。

对了现在正是活动期看视频真的会成为高手吗？视频教学真的好吗，不会让人感到烦躁、困倦？大讲台（百度搜索即可）采用任务驱动的学习模式，提倡自适应的学习，学习者根据个人自身情况，制定学习步骤和学习任务；教学过程以文字为主要内容载体，期间穿插视频，回归教育以学员为主体的核心，重在学习效果，学习体验，欢迎有兴趣的童鞋免费体验学习，体验不一样的学习方式！间，全部课程成功返回0，失败返回-1仅需700元哦！！！

声明：本站所有文章资源内容，如无特殊说明或标注，均为采集网络资源。如若本站内容侵犯了原著者的合法权益，可联系 836084111@qq.com 删除。

hadoop格式化_hadoop格式化hdfs命令

hbase创建表时出现connection closed错误

hadoop在Linux下的简单配置

如何搭建基于Hadoop的大数据平台

HDFS作命令

如何配置Hadoop环境

HADOOP 装好并格式化后，执行 hadoop fs -ls / 很长时间没反应，是怎么回事啊！

如何恢复hadoop中被删除的文件

列举一种关闭hadoop01的方法

Hadoop,用了jps后只有jps一个进程，之前格式化了两次，但是已经删包重装了，现在该怎么解决呢？

HADOOP 装好并格式化后，执行 hadoop fs -ls 显示 `.': No such file or directory

hadoop安装问题

相关文章

热门

推荐

随机