您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业文档 > MasteringRegularExpressions读书笔记
《MasteringRegularExpressions》读书笔记近段涉及到了数据的解析,自然离不开对regularexpressions(正则表达式)的温习;在jdk官方源码中看到了对《masteringregularexpressions,2ndedition》的推荐;由jeffreye.f.friedl大师主刀,o'reilly于XX年再版。对o'reilly的书向有好感,像当年误入java的歧途,没看java编程思想之类的,倒看了o'reilly的一本影印版《javainanutshell》,颇留记忆。正则表达式的“祖先”可以一直上溯至对人类神经系统如何工作的早期研究。warrenmcculloch和walterpitts这两位神经生理学家研究出一种数学方式来描述这些神经网络。1956年,一位叫stephenkleene的数学家在mcculloch和pitts早期工作的基础上,发表了一篇标题为“神经网事件的表示法”的论文,引入了正则表达式的概念。正则表达式就是用来描述他称为“正则集的代数”的表达式,因此采用“正则表达式”这个术语。随后,发现可以将这一工作应用于使用kenthompson的计算搜索算法的一些早期研究,kenthompson是unix的主要发明人。正则表达式的第一个实用应用程序就是unix中的qed编辑器。目前,正则表达式已经在很多软件中得到广泛的应用,包括*nix(linux,unix等),hp等操作系统;php,perl,python,c#,java等开发环境,以及很多的应用软件中,forexample:网络上的搜索引擎,数据库的全文检索etc...本笔记是是自我学习过程的一个整理,例子或来源于书本,或自己枚举。好了,废话一箩筐,切入正题。1、正则表达式的介绍1.1、行开始和结束^beginline。匹配行开头,如^cat匹配以cat开头的$endline。匹配行结束,如cat$匹配以cat结束的;^cat$仅仅匹配该行有cat1.2、匹配给定的字符序列[...],表示in。里面写入欲匹配的几个字符,如,匹配seperate,separete,separate;匹配,,,etc.[a-z]代表从a到z中的任意字符,[0-9]、[a-z]分别代表0-9,a-z中的任意数字或大写字母;“-”代表连续的从开始字符到结束;那么[0123456789abcdefabcdef]也可以写为[0-9a-fa-f];对于这些频繁使用的字符,各语言分别做了相同的预定义:1.3、匹配非给定的字符(非...)[^]匹配,表示not。^和行开头的标记完全一样,但写的位置不一样,则表述的意思可能完全相反,用^表示否定的意思,更多是写在[]里面,如:q[^u]匹配q后面紧跟非u的字符,如iraqi,qasida,zaqqum,iraq;没错,iraq这个单词也会被匹配,尽管q后面什么也没有,也可能有个空格、或回车符等。否定字符的意思(翻译出来绕口):meansmatchacharacterthat'snotlistedandnotdon'tmatchwhatislisted.1.4、匹配任何字符.匹配,表示any。任何字符,如07.04匹配:07_04,07-04,0704,07.04etc;如想要精确匹配07/04,07-04,or07.04;需要写07[-./]04;没错当.在[]里面包含的时候,仅仅表示“.”字符而已,如果不在[]里面,需要转义\\.如匹配形如x.y的小数:是[0-9]\\.[0-9],而非[0-9].[0-9]1.5、匹配几个给定的字符序列中的一个|匹配,表示or。tobecontinued....更多范文,敬请登陆范文大全网(fanwen.glzy8.com)!
本文标题:MasteringRegularExpressions读书笔记
链接地址:https://www.777doc.com/doc-6605543 .html