您好,欢迎访问三七文档
当前位置:首页 > 办公文档 > 统计图表 > Java正则表达式教程及示例
当我开始我的Java职业生涯的时候,对于我来说正则表达式简直是个是梦魇。本教程旨在帮助你驾驭Java正则表达式,同时也帮助我复习正则表达式。什么是正则表达式?正则表达式定义了字符串的模式。正则表达式可以用来搜索、编辑或处理文本。正则表达式并不仅限于某一种语言,但是在每种语言中有细微的差别。Java正则表达式和Perl的是最为相似的。Java正则表达式的类在java.util.regex包中,包括三个类:Pattern,Matcher和PatternSyntaxException。1.Pattern对象是正则表达式的已编译版本。他没有任何公共构造器,我们通过传递一个正则表达式参数给公共静态方法compile来创建一个pattern对象。2.Matcher是用来匹配输入字符串和创建的pattern对象的正则引擎对象。这个类没有任何公共构造器,我们用patten对象的matcher方法,使用输入字符串作为参数来获得一个Matcher对象。然后使用matches方法,通过返回的布尔值判断输入字符串是否与正则匹配。3.如果正则表达式语法不正确将抛出PatternSyntaxException异常。让我们在一个简单的例子里看看这些类是怎么用的吧123456789101112131415161718packagecom.journaldev.util;importjava.util.regex.Matcher;importjava.util.regex.Pattern;publicclassRegexExamples{publicstaticvoidmain(String[]args){//usingpatternwithflagsPatternpattern=Pattern.compile(ab,Pattern.CASE_INSENSITIVE);Matchermatcher=pattern.matcher(ABcabdAb);//usingMatcherfind(),group(),start()andend()methodswhile(matcher.find()){System.out.println(Foundthetext\+matcher.group()+\startingat+matcher.start()+indexandendingatindex+matcher.end());}//usingPatternsplit()methodpattern=Pattern.compile(\\W);String[]words=pattern.split(one@two#three:four$five);for(Strings:words){System.out.println(SplitusingPattern.split():+s);}//usingMatcher.replaceFirst()andreplaceAll()methodspattern=Pattern.compile(1*2);192021222324252627282930313233matcher=pattern.matcher(11234512678);System.out.println(UsingreplaceAll:+matcher.replaceAll(_));System.out.println(UsingreplaceFirst:+matcher.replaceFirst(_));}}上述程序的输出是:InputStringmatchesregex-trueExceptioninthreadmainjava.util.regex.PatternSyntaxException:Danglingmetacharacter'*'nearindex0*xx*^atjava.util.regex.Pattern.error(Pattern.java:1924)atjava.util.regex.Pattern.sequence(Pattern.java:2090)atjava.util.regex.Pattern.expr(Pattern.java:1964)atjava.util.regex.Pattern.compile(Pattern.java:1665)atjava.util.regex.Pattern.(Pattern.java:1337)atjava.util.regex.Pattern.compile(Pattern.java:1022)atcom.journaldev.util.PatternExample.main(PatternExample.java:13)既然正则表达式总是和字符串有关,Java1.4对String类进行了扩展,提供了一个matches方法来匹配pattern。在方法内部使用Pattern和Matcher类来处理这些东西,但显然这样减少了代码的行数。Pattern类同样有matches方法,可以让正则和作为参数输入的字符串匹配,输出布尔值结果。下述的代码可以将输入字符串和正则表达式进行匹配。123Stringstr=bbb;System.out.println(UsingStringmatchesmethod:+str.matches(.bb));System.out.println(UsingPatternmatchesmethod:+Pattern.matches(.bb,str));所以如果你的需要仅仅是检查输入字符串是否和pattern匹配,你可以通过调用String的matches方法省下时间。只有当你需要操作输入字符串或者重用pattern的时候,你才需要使用Pattern和Matches类。注意由正则定义的pattern是从左至右应用的,一旦一个原字符在一次匹配中使用过了,将不会再次使用。例如,正则“121”只会匹配两次字符串“31212142121″,就像这样“_121____121″。正则表达式通用匹配符号正则表达式说明示例.Matchesanysinglesign,includeseverything匹配任何单个符号,包括所有字符(“..”,“a%”)–true(“..”,“.a”)–true(“..”,“a”)–false^xxx在开头匹配正则xxx(“^a.c.”,“abcd”)–true(“^a”,“a”)–true(“^a”,“ac”)–falsexxx$在结尾匹配正则xxx(“..cd$”,“abcd”)–true(“a$”,“a”)–true(“a$”,“aca”)–false[abc]能够匹配字母a,b或c。[]被称为characterclasses。(“^[abc]d.”,“ad9″)–true(“[ab].d$”,“bad”)–true(“[ab]x”,“cx”)–false[abc][12]能够匹配由1或2跟着的a,b或c(“[ab][12].”,“a2#”)–true(“[ab]..[12]“,“acd2″)–true(“[ab][12]“,“c2″)–false[^abc]当^是[]中的第一个字符时代表取反,匹配除了a,b或c之外的任意字符。(“[^ab][^12].”,“c3#”)–true(“[^ab]..[^12]“,“xcd3″)–true(“[^ab][^12]“,“c2″)–false正则表达式说明示例[a-e1-8]匹配a到e或者1到8之间的字符(“[a-e1-3].”,“d#”)–true(“[a-e1-3]“,“2″)–true(“[a-e1-3]“,“f2″)–falsexx|yy匹配正则xx或者yy(“x.|y”,“xa”)–true(“x.|y”,“y”)–true(“x.|y”,“yz”)–falseJava正则表达式元字符正则表达式说明\d任意数字,等同于[0-9]\D任意非数字,等同于[^0-9]\s任意空白字符,等同于[\t\n\x0B\f\r]\S任意非空白字符,等同于[^\s]\w任意英文字符,等同于[a-zA-Z_0-9]\W任意非英文字符,等同于[^\w]\b单词边界\B非单词边界有两种方法可以在正则表达式中像一般字符一样使用元字符。1.在元字符前添加反斜杠(\)2.将元字符置于\Q(开始引用)和\E(结束引用)间正则表达式量词量词指定了字符匹配的发生次数。正则表达式说明x?x没有出现或者只出现一次X*X出现0次或更多X+X出现1次或更多X{n}X正好出现n次X{n,}X出席n次或更多X{n,m}X出现至少n次但不多于m次量词可以和characterclasses和capturinggroup一起使用。例如,[abc]+表示a,b或c出现一次或者多次。(abc)+表示capturinggroup“abc”出现一次或多次。我们即将讨论capturinggroup。正则表达式capturinggroupCapturinggroup是用来对付作为一个整体出现的多个字符。你可以通过使用()来建立一个group。输入字符串中和capturinggroup相匹配的部分将保存在内存里,并且可以通过使用Backreference调用。你可以使用matcher.groupCount方法来获得一个正则pattern中capturinggroups的数目。例如((a)(bc))包含3个capturinggroups;((a)(bc)),(a)和(bc)。你可以使用在正则表达式中使用Backreference,一个反斜杠(\)接要调用的group号码。Capturinggroups和Backreferences可能很令人困惑,所以我们通过一个例子来理解。1234System.out.println(Pattern.matches((\\w\\d)\\1,a2a2));//trueSystem.out.println(Pattern.matches((\\w\\d)\\1,a2b2));//falseSystem.out.println(Pattern.matches((AB)(B\\d)\\2\\1,ABB2B2AB));//trueSystem.out.println(Pattern.matches((AB)(B\\d)\\2\\1,ABB2B3AB));//false在第一个例子里,运行的时候第一个capturinggroup是(\w\d),在和输入字符串“a2a2″匹配的时候获取“a2″并保存到内存里。因此\1是”a2”的引用,并且返回true。基于相同的原因,第二行代码打印false。试着自己理解第三行和第四行代码。:)现在我们来看看Pattern和Matcher类中一些重要的方法。我们可以创建一个带有标志的Pattern对象。例如Pattern.CASE_INSENSITIVE可以进行大小写不敏感的匹配。Pattern类同样提供了和String类相似的split(String)方法Pattern类toString()方法返回被编译成这个pattern的正则表达式字符串。Matcher类有start()和end()索引方法,他们可以显示从输入字符串中匹配到的准确位置。Matcher类同样提供了字符串操作方法replaceAll(Stringreplacement)和replaceFirst(Stringreplacement)。现在我们在一个简单的java类中看看这些函数是怎么用的。1234567891011121314151617181920212223242526272829packagecom.journaldev.util;importjava.util.regex.Matcher;importjava.util.regex.Pattern;publicclassRegexExamples{publicstaticvoidmain(String[]args){//usingpatternwithflagsPatternpat
本文标题:Java正则表达式教程及示例
链接地址:https://www.777doc.com/doc-2878765 .html