您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 经营企划 > Linux入门系列教程(九)之简单的文本处理
实验楼官方网站:简单的文本处理一、常用的文本处理命令这一节我们将介绍这几个命令tr(注意不是tar),col,join,paste。实际这一节是上一节关于能实现管道操作的命令的延续,所以我们依然将结合管道来熟悉这些命令的使用。二、文本处理命令1.tr命令tr命令可以用来删除一段文本信息中的某些文字。或者将其进行转换使用方式:tr[option]...SET1[SET2]常用的选项有:选项说明-d删除和set1匹配的字符,注意不是全词匹配也不是按字符顺序匹配-s去除set1指定的在输入文本中连续并重复的字符操作举例:#删除helloshiyanlou中所有的'o','l','h'$echo'helloshiyanlou'|tr-d'olh'#将hello中的ll,去重为一个l$echo'hello'|tr-s'l'#将输入文本,全部转换为大写或小写输出$cat/etc/passwd|tr'[:lower:]''[:upper:]'#上面的'[:lower:]''[:upper:]'你也可以简单的写作'[a-z]''[A-Z]',当然反过来将大写变小写也是可以的实验楼官方网站:的使用,你可以使用--help或者mantr获得思考练习还记得我们在讲打包压缩那一节提到windows/dos与linux/unix文本文件一些特殊字符不一致的问题,如断行符windows为CR+LF(\r\n),unix/linux为LF(\n),你使用cat-A文本你可以看到文本中包含的不可见特殊字符。linux的\n表现出来就是一个$,而windows/dos的表现为^M$,你可以直接使用dos2unix和unix2dos工具在两种格式之间进行转换,使用file命令可以查看文件的具体类型。不过现在希望你在不使用上述两个转换工具的情况下,使用前面学过的命令手动完成dos文本格式到unix文本格式的转换。2.col命令col命令可以将Tab换成对等数量的空格建,或反转这个操作。这用来格式化代码很爽啊使用方式:col[option]常用的选项有:选项说明-x将Tab转换为空格-h将空格转换为Tab(默认选项)实验楼官方网站:操作举例:#查看/etc/protocols中的不可见字符,可以看到很多^I,这其实就是Tab键转义成可见字符的符号$cat-A/etc/protocols#使用col-x将/etc/protocols中的Tab转换为空格,然后再使用cat查看,你发现^I不见了$cat/etc/protocols|col-x|cat-A3.join命令学过数据库的用户对这个应该不会陌生,这个命令就是用于将两个文件中包含相同内容的那一行合并在一起,Talkischeep,showmethecode,那就看下面吧使用方式:join[option]...file1file2常用的选项有:选项说明-t指定分隔符,默认为空格-i忽略大小写的差异-1指明第一个文件要用哪个字段来对比,,默认对比第一个字段实验楼官方网站:指明第二个文件要用哪个字段来对比,,默认对比第一个字段操作举例:#创建两个文件$echo'1hello'file1$echo'1shiyanlou'file2$joinfile1file2#将/etc/passwd与/etc/shadow两个文件合并,指定以':'作为分隔符$sudojoin-t':'/etc/passwd/etc/shadow#将/etc/passwd与/etc/group两个文件合并,指定以':'作为分隔符,分别比对第4和第3个字段$sudojoin-t':'-14/etc/passwd-23/etc/group4.paste命令paste这个命令实际就是上面join的懒人版,它是在不对比数据的情况下,简单粗暴的将多个文件合并一起,以Tab隔开使用方式:paste[option]file...常用的选项有:选项说明-d指定合并的分隔符,默认为Tab实验楼官方网站:不合并到一行,每个文件为一行操作举例:$echohellofile1$echoshiyanloufile2$echo:'file1file2file3$paste-sfile1file2file3三、小结上面这些命令不是所有你都会经常用到,不过你不得不承认的是它们确实很实用,熟练掌握之后,可以为你减轻很多工作量,试想你不停的用鼠标操作在gedit里面复制粘贴赋值粘贴,将两个文件的内容合并为一个文件,这原本只需要一个命名就能完成的事情。四、linux乐趣多还记得小时候在小霸王上面玩得小蜜蜂游戏么,它的正统名字应该是SpaceInvaders:太空侵略者。怀念万分吧,话说“怀念不如相见”,我们就来在命令行下重拾童趣吧使用下面这个命令就可以安装,之所以加了叫ninvaders是因为这款游戏是基于ncurses命令行图形库做的sudoapt-getinstallninvaders实验楼官方网站:入门系列教程:
本文标题:Linux入门系列教程(九)之简单的文本处理
链接地址:https://www.777doc.com/doc-3018271 .html