深化浅出之正则表达式[VC/C++编程]
本文“深化浅出之正则表达式[VC/C++编程]”是由七道奇为您精心收集,来源于网络转载,文章版权归文章作者所有,本站不对其观点以及内容做任何评价,请读者自行判断,以下是其具体内容:
前言:
半年前我对正则表达式产生了爱好,在网上查找过不少资料,看过不少的教程,最后在利用一个正则表达式工具RegexBuddy时发现他的教程写的非常好,可以说是我目前见过最好的正则表达式教 程.于是一向想把他翻译过来.这个希望直到这个五一长假才得以实现,后果就有了这篇文章.关于本 文的名字,利用“深化浅出”仿佛已经太俗.但是通读原文今后,认为只有效“深化浅 出”才能精确的表达出该教程给我的感受,所以也就不能免俗了.
本文是Jan Goyvaerts为RegexBuddy写的教程的译文,版权归原作者全部,欢送转载.但是为了恭敬原作者和译者的劳动,请注明出处!谢谢!
1.什么是正则表达式
基本说来,正则表 达式是一种用来描写一定数目文本的情势.Regex代表Regular Express.本文将用 <<regex>>来表示一段具体的正则表达式.
一段文本就是最基本的情势,简单 的匹配相同的文本.
2.差别的正则表达式引擎
正则表达式引擎是一 种可以处理正则表达式的软件.普通,引擎是更大的利用程序的一部份.在软件世界,差别的正则表达 式并不彼此兼容.本教程堆积合谈论Perl 5 范例的引擎,因为这种引擎是利用最遍及的引擎.同时我们 也会提到一些和其他引擎的辨别.很多近代的引擎都很近似,但不完好一样.比方.NET正则库,JDK正则 包.
3.文字标记
最基本的正则表达式由单个文字标记构成.如 <<a>>,它将匹配字符串中第一次呈现的字符“a”.如对字符串“Jack is a boy”.“J”后的“a”将被匹配.而第二个“a”将不会 被匹配.
正则表达式也可以匹配第二个“a”,这必须是你奉告正则表达式引擎从第一次匹配 的地方开始搜索.在文本编辑器中,你可以利用“查找下一个”.在编程语言中,会有一个 函数可以使你早年一次匹配的位置开始持续向后搜索.
近似的,<<cat>>会匹 配“About cats and dogs”中的“cat”.这等于是奉告正则表达式引擎,找到 一个<<c>>,紧跟一个<<a>>,再跟一个<<t>>.
要 注意,正则表达式引擎缺省是大小写敏感的.除非你奉告引擎忽视大小写,不然<<cat>>不 会匹配“Cat”.
·特别字符
关于文字字符 ,有11个字符被保存作特别用处.他们是:
[ ] \ ^ $ .| ? * + ( )
这些特别 字符也被称作元字符.
假如你想在正则表达式中将这些字符用作文本字符,你需求用反斜杠 “\”对其举行换码 (escape).比方你想匹配“1+1=2”,精确的表达式为 <<1\+1=2>>.
需求注意的是,<<1+1=2>>也是有效的正则表达式. 但它不会匹配“1+1=2”,而会匹配“123+111=234”中的“111=2”. 因为“+”在这里表示特别含义(反复1次到多次).
在编程语言中,要注意,一 些特别的字符会先被编译器处理,然后再传送给正则引擎.因此正则表达式<<1\+2=2>>在 C++中要写成“1\\+1=2”.为了匹配“C:\temp”,你要用正则表达式 <<C:\\temp>>.而在C++中,正则表达式则变成了“C:\\\\temp”.
·不可显示字符
可以利用特别字符序列来代表某些不可显示字符:
<<\t>>代表Tab (0x09)
<<\r>>代表回车符(0x0D)
<<\n>>代表换行符 (0x0A)
要注意的是Windows中文本文件利用“\r\n”来完毕一行而Unix利用 “\n”.
以上是“深化浅出之正则表达式[VC/C++编程]”的内容,如果你对以上该文章内容感兴趣,你可以看看七道奇为您推荐以下文章:
本文地址: | 与您的QQ/BBS好友分享! |