您好,欢迎访问三七文档
HDFS维护手册(0.19.1)1HDFS概述HDFS是Hadoop应用用到的一个最主要的分布式存储系统。一个HDFS集群主要由一个NameNode和很多个Datanode组成:Namenode管理文件系统的元数据,而Datanode存储了实际的数据。本文档主要关注用户以及管理员怎样和HDFS进行交互。基本上,客户端联系Namenode以获取文件的元数据或修饰属性,而真正的文件I/O操作是直接和Datanode进行交互的。本文档从介绍如何安装和搭建HDFS集群入手,接着常用的文件系统命令,以及维护过程中涉及到的控制命令。2HDFS集群部署2.1安装1)用户从hadoop官方网站下载所需版本的安装文件,下载地址为:;本文档选取的版本为hadoop-0.19.1;2)将下载的压缩文件解压,目录为./hadoop-0.19.1,按照附录《hdfs测试组网方案》中系统参数配置部分,修改./hadoop-0.19.1/conf中的文件;3)检查所有服务器上是否安装了J2sdk,要求版本为1.5及以上;并建立安装目录到/usr/local/j2sdk的软链接;4)将hadoop目录上传到所有的服务器,放置在${HADOOP_HOME}目录下;5)挂载namenode和secondarynamenode的fsimage,editslogs备份目录;2.2启动1)进入namenode的${HADOOP_HOME};2)格式化namenode文件系统,执行命令:bin/hadoopnamenode–format;3)启动hdfs,执行命令:bin/start-dfs.sh。该脚本首先启动namenode,然后读取./conf/slaves中的datanode列表,逐个启动;最后读取./conf/masters中secondarynamenode地址,启动secondarynamenode。启动datanode和secondarynamenode时,脚本通过ssh从当前机器登录到其他节点的,涉及到身份验证,需要输入相应的密码信息,比较繁琐。可参考ssh中免密码登录解决方法。3FSShell使用指南调用文件系统(FS)Shell命令应使用bin/hadoopfsargs的形式。所有的的FSshell命令使用URI路径作为参数。URI格式是scheme://authority/path。对HDFS文件系统,scheme是hdfs,对本地文件系统,scheme是file。其中scheme和authority参数都是可选的,如果未加指定,就会使用配置中指定的默认scheme。一个HDFS文件或目录比如/parent/child可以表示成hdfs://namenode:namenodeport/parent/child,或者更简单的/parent/child(假设你配置文件中的默认值是namenode:namenodeport)。大多数FSShell命令的行为和对应的UnixShell命令类似,不同之处会在下面介绍各命令使用详情时指出。出错信息会输出到stderr,其他信息输出到stdout。3.1cat使用方法:hadoopfs-catURI[URI…]将路径指定文件的内容输出到stdout。示例:hadoopfs-cathdfs://host1:port1/file1hdfs://host2:port2/file2hadoopfs-catfile:///file3/user/hadoop/file4返回值:成功返回0,失败返回-1。3.2chgrp使用方法:hadoopfs-chgrp[-R]GROUPURI[URI…]Changegroupassociationoffiles.With-R,makethechangerecursivelythroughthedirectorystructure.Theusermustbetheowneroffiles,orelseasuper-user.AdditionalinformationisinthePermissionsUserGuide.改变文件所属的组。使用-R将使改变在目录结构下递归进行。命令的使用者必须是文件的所有者或者超级用户。更多的信息请参见HDFS权限用户指南。3.3chmod使用方法:hadoopfs-chmod[-R]MODE[,MODE]...|OCTALMODEURI[URI…]改变文件的权限。使用-R将使改变在目录结构下递归进行。命令的使用者必须是文件的所有者或者超级用户。更多的信息请参见HDFS权限用户指南。3.4chown使用方法:hadoopfs-chown[-R][OWNER][:[GROUP]]URI[URI]改变文件的拥有者。使用-R将使改变在目录结构下递归进行。命令的使用者必须是超级用户。更多的信息请参见HDFS权限用户指南。3.5copyFromLocal使用方法:hadoopfs-copyFromLocallocalsrcURI除了限定源路径是一个本地文件外,和put命令相似。3.6copyToLocal使用方法:hadoopfs-copyToLocal[-ignorecrc][-crc]URIlocaldst除了限定目标路径是一个本地文件外,和get命令类似。3.7cp使用方法:hadoopfs-cpURI[URI…]dest将文件从源路径复制到目标路径。这个命令允许有多个源路径,此时目标路径必须是一个目录。示例:hadoopfs-cp/user/hadoop/file1/user/hadoop/file2hadoopfs-cp/user/hadoop/file1/user/hadoop/file2/user/hadoop/dir返回值:成功返回0,失败返回-1。3.8du使用方法:hadoopfs-duURI[URI…]显示目录中所有文件的大小,或者当只指定一个文件时,显示此文件的大小。示例:hadoopfs-du/user/hadoop/dir1/user/hadoop/file1hdfs://host:port/user/hadoop/dir1返回值:成功返回0,失败返回-1。3.9dus使用方法:hadoopfs-dusargs显示文件的大小。3.10expunge使用方法:hadoopfs-expunge清空回收站。请参考HDFS设计文档以获取更多关于回收站特性的信息。3.11get使用方法:hadoopfs-get[-ignorecrc][-crc]srclocaldst复制文件到本地文件系统。可用-ignorecrc选项复制CRC校验失败的文件。使用-crc选项复制文件以及CRC信息。示例:hadoopfs-get/user/hadoop/filelocalfilehadoopfs-gethdfs://host:port/user/hadoop/filelocalfile返回值:成功返回0,失败返回-1。3.12getmerge使用方法:hadoopfs-getmergesrclocaldst[addnl]接受一个源目录和一个目标文件作为输入,并且将源目录中所有的文件连接成本地目标文件。addnl是可选的,用于指定在每个文件结尾添加一个换行符。3.13ls使用方法:hadoopfs-lsargs如果是文件,则按照如下格式返回文件信息:文件名副本数文件大小修改日期修改时间权限用户ID组ID如果是目录,则返回它直接子文件的一个列表,就像在Unix中一样。目录返回列表的信息如下:目录名dir修改日期修改时间权限用户ID组ID示例:hadoopfs-ls/user/hadoop/file1/user/hadoop/file2hdfs://host:port/user/hadoop/dir1/nonexistentfile返回值:成功返回0,失败返回-1。3.14lsr使用方法:hadoopfs-lsrargsls命令的递归版本。类似于Unix中的ls-R。3.15mkdir使用方法:hadoopfs-mkdirpaths接受路径指定的uri作为参数,创建这些目录。其行为类似于Unix的mkdir-p,它会创建路径中的各级父目录。示例:hadoopfs-mkdir/user/hadoop/dir1/user/hadoop/dir2hadoopfs-mkdirhdfs://host1:port1/user/hadoop/dirhdfs://host2:port2/user/hadoop/dir返回值:成功返回0,失败返回-1。3.16movefromLocal使用方法:dfs-moveFromLocalsrcdst输出一个”notimplemented“信息。3.17mv使用方法:hadoopfs-mvURI[URI…]dest将文件从源路径移动到目标路径。这个命令允许有多个源路径,此时目标路径必须是一个目录。不允许在不同的文件系统间移动文件。不支持文件夹重命令。示例:hadoopfs-mv/user/hadoop/file1/user/hadoop/file2hadoopfs-mvhdfs://host:port/file1hdfs://host:port/file2hdfs://host:port/file3hdfs://host:port/dir1返回值:成功返回0,失败返回-1。3.18put使用方法:hadoopfs-putlocalsrc...dst从本地文件系统中复制单个或多个源路径到目标文件系统。也支持从标准输入中读取输入写入目标文件系统。hadoopfs-putlocalfile/user/hadoop/hadoopfilehadoopfs-putlocalfile1localfile2/user/hadoop/hadoopdirhadoopfs-putlocalfilehdfs://host:port/hadoop/hadoopfilehadoopfs-put-hdfs://host:port/hadoop/hadoopfile从标准输入中读取输入。返回值:成功返回0,失败返回-1。3.19rm使用方法:hadoopfs-rmURI[URI…]删除指定的文件。只删除非空目录和文件。请参考rmr命令了解递归删除。示例:hadoopfs-rmhdfs://host:port/file/user/hadoop/emptydir返回值:成功返回0,失败返回-1。3.20rmr使用方法:hadoopfs-rmrURI[URI…]delete的递归版本。示例:hadoopfs-rmr/user/hadoop/dirhadoopfs-rmrhdfs://host:port/user/hadoop/dir返回值:成功返回0,失败返回-1。3.21setrep使用方法:hadoopfs-setrep[-R]path改变一个文件的副本系数。-R选项用于递归改变目录下所有文件的副本系数。示例:hadoopfs-setrep-w3-R/user/hadoop/dir1返回值:成功返回0,失败返回-1。3.22stat使用方法:hadoopfs-statURI[URI…]返回指定路径的统计信息。示例:hadoopfs-statpath返回值:成功返回0,失败返回-1。3.23tail使用方法:hadoopfs-tail[-f]URI将文件尾部1K字节的内容输出到stdout。支持-f选项,行为和Unix中一致。示例:hadoopfs-tailpathname返回值:成功返回0,失败返回-1。3.24test使用方法:hadoopfs-test-[ezd]URI选项:-e检查文件是否存在。如果存在则返回0。-z检查文件是否是0字节。如果是则返回0。-d如果路径是个目录
本文标题:HDFS 维护手册
链接地址:https://www.777doc.com/doc-5591921 .html