您好,欢迎访问三七文档
崔嘉佳陈甜贾玮张耀方房晓孟目录123正则表达式作用正则表达式内容正则表达式用法内容正则表达式,RegularExpression(也称为“regex”或“regexp”),是一种用来描述文本模式的特殊语法。一个正则表达式由普通字符(例如字符“a”到“z”)以及特殊字符(称为元字符,如“\”、“*”、“?”等)组成。简单地说,一个正则表达式就是你需要匹配的字符串。例如,正则表达式“A*B”匹配字符串“ACCCB”但是不匹配“ACCCC”。正则表达式定义内容•元字符•通配符•限定符•定位符•表示范围和选择的元字符•转义符•非捕获元字符•……如何构造正则表达式•构造正则表达式的方法和创建数学表达式的方法一样。也就是用多种元字符与操作符将小的表达式结合在一起来创建更大的表达式。正则表达式的组件可以是单个字符、字符集合、字符范围、字符间的选择或者所有这些组件的任意组合。正则表达式作用搜索/匹配替换验证数据格式验证数据有效性数据分析……字符串的搜索、匹配•字符串对象的方法中,“search”和“match”方法用来搜索字符串中对应的内容。•“search”方法的语法是:•intIndex=stringObject.search(rgExp);•下面是一个简单的“search”方法使用示例:•functionSearchTest(){•varr,re;•vars=ThequickbrownFireFoxjumpsoveralazydog.;•re=/firefox/i;•r=s.search(re);•return(r);•}字符串的替换•字符串对象有着“replace”方法,用来替换字符串中某些部分。“replace”方法的语法为:•strValue=stringObject.replace(rgExp,replaceText);正则表达式类库输入文字在此Boost.regex,动态正则表达式Boost.spirit,静态正则表达式Boost.xpressive,动态和静态正则表达式TPL(TextProcessingLibrary),静态正则表达式……正则对象的属性•正则表达式对象的属性有4个:“global”,“ignoreCase”,“multiline”和“source”。其引用的语法为:•booleanValue=regObject.global;•booleanValue=regObject.ignoreCase;•booleanValue=regObject.multiline;•booleanValue=regObject.source;我们的大作业:当今世界“氧吧”当下社会人普遍存在“亚健康”的状态,可是快节奏的生活使人们无法停下来去了解健康,无法停下来去了解如何养生。而追求高品质的健康生活已经成为当下生活的主流。21世纪,是互联网的时代,信息量大,我们的“氧吧”的宗旨就是在海量化的网络信息里面使人们快速的获取高权威的健康养生知识我们的大作业:当今世界“氧吧”通过深度搜索的方法,在三个微博(腾讯、网易、新浪)里面抓取有关健康养生的信息,通过一定的算法将抓取来的信息进行权威性排序和去重。另一方面,我们在几个关键性的健康养生网站进行网页抓取,在我们的“氧吧”里面开辟出一个当下健康养生的热点话题,让人们在短时间内获取最新消息。抓取软件:通过学长的推荐,我们用火车头采集器进行信息抓取,目前正在学习这个软件。谢谢观赏
本文标题:浅析正则表达式
链接地址:https://www.777doc.com/doc-3202277 .html