您好,欢迎访问三七文档
有一段时间,正则表达式学习很火热很潮流,当时在CSDN一天就能看到好几个正则表达式的帖子,那段时间借助论坛以及WroxPress出版的《C#字符串和正则表达式参考手册》学习了一些基础的知识,同时也为我在CSDN大概赚了1000分,今天想起来,去找《C#字符串和正则表达式参考手册》时,已经不知所踪了。现在用到正则的时候也比较少,把以前的笔记等整理一下,以志不忘。(1)“@”符号符下两ows表研究室的火热,当晨在“@”虽然并非C#正则表达式的“成员”,但是它经常与C#正则表达式出双入对。“@”表示,跟在它后面的字符串是个“逐字字符串”,不是很好理解,举个例子,以下两个声明是等效的:stringx=D:\\MyHuang\\MyDoc;stringy=@D:\MyHuang\MyDoc;事实上,如果按如下声明,C#将会报错,因为“\”在C#中用于实现转义,如“\n”换行:stringx=D:\MyHuang\MyDoc;(2)基本的语法字符。\d0-9的数字\D\d的补集(以所以字符为全集,下同),即所有非数字的字符\w单词字符,指大小写字母、0-9的数字、下划线\W\w的补集\s空白字符,包括换行符\n、回车符\r、制表符\t、垂直制表符\v、换页符\f\S\s的补集.除换行符\n外的任意字符[…]匹配[]内所列出的所有字符[^…]匹配非[]内所列出的字符下面提供一些简单的示例:stringi=\n;stringm=3;Regexr=newRegex(@\D);//同Regexr=newRegex(\\D);//r.IsMatch(i)结果:true//r.IsMatch(m)结果:falsestringi=%;stringm=3;Regexr=newRegex([a-z0-9]);//匹配小写字母或数字字符//r.IsMatch(i)结果:false//r.IsMatch(m)结果:true(3)定位字符“定位字符”所代表的是一个虚的字符,它代表一个位置,你也可以直观地认为“定位字符”所代表的是某个字符与字符间的那个微小间隙。^表示其后的字符必须位于字符串的开始处$表示其前面的字符必须位于字符串的结束处\b匹配一个单词的边界\B匹配一个非单词的边界另外,还包括:\A前面的字符必须位于字符处的开始处,\z前面的字符必须位于字符串的结束处,\Z前面的字符必须位于字符串的结束处,或者位于换行符前下面提供一些简单的示例:Codestringi=Livefornothing,dieforsomething;Regexr1=newRegex(^Livefornothing,dieforsomething$);//r1.IsMatch(i)trueRegexr2=newRegex(^Livefornothing,dieforsome$);//r2.IsMatch(i)falseRegexr3=newRegex(^Livefornothing,dieforsome);//r3.IsMatch(i)truestringi=@Livefornothing,dieforsomething;//多行Regexr1=newRegex(^Livefornothing,dieforsomething$);Console.WriteLine(r1matchcount:+r1.Matches(i).Count);//0Regexr2=newRegex(^Livefornothing,dieforsomething$,RegexOptions.Multiline);Console.WriteLine(r2matchcount:+r2.Matches(i).Count);//0Regexr3=newRegex(^Livefornothing,\r\ndieforsomething$);Console.WriteLine(r3matchcount:+r3.Matches(i).Count);//1Regexr4=newRegex(^Livefornothing,$);Console.WriteLine(r4matchcount:+r4.Matches(i).Count);//0Regexr5=newRegex(^Livefornothing,$,RegexOptions.Multiline);Console.WriteLine(r5matchcount:+r5.Matches(i).Count);//0Regexr6=newRegex(^Livefornothing,\r\n$);Console.WriteLine(r6matchcount:+r6.Matches(i).Count);//0Regexr7=newRegex(^Livefornothing,\r\n$,RegexOptions.Multiline);Console.WriteLine(r7matchcount:+r7.Matches(i).Count);//0Regexr8=newRegex(^Livefornothing,\r$);Console.WriteLine(r8matchcount:+r8.Matches(i).Count);//0Regexr9=newRegex(^Livefornothing,\r$,RegexOptions.Multiline);Console.WriteLine(r9matchcount:+r9.Matches(i).Count);//1Regexr10=newRegex(^dieforsomething$);Console.WriteLine(r10matchcount:+r10.Matches(i).Count);//0Regexr11=newRegex(^dieforsomething$,RegexOptions.Multiline);Console.WriteLine(r11matchcount:+r11.Matches(i).Count);//1Regexr12=newRegex(^);Console.WriteLine(r12matchcount:+r12.Matches(i).Count);//1Regexr13=newRegex($);Console.WriteLine(r13matchcount:+r13.Matches(i).Count);//1Regexr14=newRegex(^,RegexOptions.Multiline);Console.WriteLine(r14matchcount:+r14.Matches(i).Count);//2Regexr15=newRegex($,RegexOptions.Multiline);Console.WriteLine(r15matchcount:+r15.Matches(i).Count);//2Regexr16=newRegex(^Livefornothing,\r$\n^dieforsomething$,RegexOptions.Multiline);Console.WriteLine(r16matchcount:+r16.Matches(i).Count);//1//对于一个多行字符串,在设置了Multiline选项之后,^和$将出现多次匹配。stringi=Livefornothing,dieforsomething;stringm=Livefornothing,dieforsomething;Regexr1=newRegex(@\bthing\b);Console.WriteLine(r1matchcount:+r1.Matches(i).Count);//0Regexr2=newRegex(@thing\b);Console.WriteLine(r2matchcount:+r2.Matches(i).Count);//2Regexr3=newRegex(@\bthing\b);Console.WriteLine(r3matchcount:+r3.Matches(m).Count);//1Regexr4=newRegex(@\bforsomething\b);Console.WriteLine(r4matchcount:+r4.Matches(i).Count);//1//\b通常用于约束一个完整的单词(4)重复描述字符“重复描述字符”是体现C#正则表达式“很好很强大”的地方之一:{n}匹配前面的字符n次{n,}匹配前面的字符n次或多于n次{n,m}匹配前面的字符n到m次?匹配前面的字符0或1次+匹配前面的字符1次或多于1次*匹配前面的字符0次或式于0次以下提供一些简单的示例:Codestringx=1024;stringy=+1024;stringz=1,024;stringa=1;stringb=-1024;stringc=10000;Regexr=newRegex(@^\+?[1-9],?\d{3}$);Console.WriteLine(xmatchcount:+r.Matches(x).Count);//1Console.WriteLine(ymatchcount:+r.Matches(y).Count);//1Console.WriteLine(zmatchcount:+r.Matches(z).Count);//1Console.WriteLine(amatchcount:+r.Matches(a).Count);//0Console.WriteLine(bmatchcount:+r.Matches(b).Count);//0Console.WriteLine(cmatchcount:+r.Matches(c).Count);//0//匹配1000到9999的整数。(5)择一匹配C#正则表达式中的(|)符号似乎没有一个专门的称谓,姑且称之为“择一匹配”吧。事实上,像[a-z]也是一种择一匹配,只不过它只能匹配单个字符,而(|)则提供了更大的范围,(ab|xy)表示匹配ab或匹配xy。注意“|”与“()”在此是一个整体。下面提供一些简单的示例:Codestringx=0;stringy=0.23;stringz=100;stringa=100.01;stringb=9.9;stringc=99.9;stringd=99.;stringe=00.1;Regexr=newRegex(@^\+?((100(.0+)*)|([1-9]?[0-9])(\.\d+)*)$);Console.WriteLine(xmatchcount:+r.Matches(x).Count);//1Console.WriteLine(ymatchcount:+r.Matches(y).Count);//1Console.WriteLine(zmatchcount:+r.Matches(z).Count);//1Console.WriteLine(amatchcount:+r.Matches(a).Count);//0Console.WriteLine(bmatchcount:+r.Matches(b).Count);//1Console.WriteLine(cmatchcount:+r.Matches(c).Count);//1Console.WriteLine(dmatchcount:+r.Matches(d).Count);//0Console.WriteLine(ematchcount:+r.Matches(e).Count);//0//匹配0到100的数。最外层的括号内包含两部分“(100(.0+)*)”,“([1-9]?[0-9])(\.\d+)*”,这两部分是“OR”的关系,即正则表达式引擎会先尝试匹配100,如果失败,则尝试匹配后一个表达式(表示[0,100)范围中的数字)。(6)特殊字符的匹配下面提供一些简单的示例:Codestringx=\\;Regexr1=newReg
本文标题:c#正则表达式整理
链接地址:https://www.777doc.com/doc-3391475 .html