在VS2008中使用正则表达式库 Boost.Regex

2011-02-24 wcdj

 

在VS2008中要使用Boost.Regex正则表达式库,首先需要在编译器中添加Boost的lib目录,否则编译将会出现如下错误提示:

1>------ 已启动生成: 项目: vs08, 配置: Debug Win32 ------
1>正在编译...
1>vs08.cpp
1>正在链接...
1>LINK : fatal error LNK1104: 无法打开文件“libboost_regex-vc90-mt-sgd-1_44.lib”
1>生成日志保存在“file://e:/Do/vs08/vs08/Debug/BuildLog.htm”
1>vs08 - 1 个错误,0 个警告
========== 生成: 成功 0 个,失败 1 个,最新 1 个,跳过 0 个 ==========

添加lib的方法:
方法1:依次点击“项目——配置属性——链接器——常规”,在“附加库目录”中加入lib所在目录。例如,我的机子上是:"C:/Program Files/boost/boost_1_44/lib"。
方法2:将libboost_regex-vc90-mt-sgd-1_44.lib复制到工程目录下,然后在代码中添加如下声明:
#pragma comment(lib,"libboost_regex-vc90-mt-sgd-1_44.lib")

Boost C++的正则表达式库Boost.Regex可以应用正则表达式于C++。正则表达式大大减轻了搜索特定模式字符串的负担,在很多语言中都是强大的功能。虽然现在C++仍然需要以Boost C++库的形式提供这一功能,但是在将来正则表达式将进入C++标准库。Boost.Regex库有望包括在下一版的C++标准中。
Boost.Regex库中两个最重要的类是boost::regex和boost::smatch,它们都在boost/regex.hpp文件中定义。前者用于定义一个正则表达式,而后者可以保存搜索结果。

三个搜索正则表达式的函数
(1) 函数boost::regex_match() 用于字符串与正则表达式的比较。在整个字符串匹配正则表达式时其返回值为true。
(2) 函数boost::regex_search() 用于在字符串中搜索正则表达式。
注意:
[1] 函数boost::regex_search()可以接受一个类型为boost::smatch的引用的参数用于存储结果。函数boost::regex_search()只用于分类的搜索。存储结果的类boost::smatch事实上是持有类型为boost::sub_match的元素的容器,可以通过与类std::vector相似的界面访问。例如,元素可以通过操作符operator[]()访问。
[2] 另一方面,类boost::sub_match将迭代器保存在对应于正则表达式分组的位置。因为它继承自类std::pair,迭代器引用的子串可以使用first和second访问。
[3] 请注意结果保存在迭代器中而boost::sub_match类并不复制它们,这说明它们只是在被迭代器引用的相关字符串存在时才可以访问。
[4] 还需要注意容器boost::smatch的第一个元素存储的引用是指向匹配正则表达式的整个字符串的,匹配第一组的第一个子串由索引1访问。
(3) 函数boost::regex_replace() 需要一个格式参数,它决定了子串、匹配正则表达式的分组如何被替换。如果正则表达式不包含任何分组,相关子串将被用给定的格式一个个地被替换。

注意 :对于正则表达式和格式有不同的标准。以上3个函数都可以接受一个额外的参数,用于选择具体的标准。也可以指定是否以某一具体格式解释特殊字符或者替代匹配正则表达式的整个字符串。

 

#include <boost/regex.hpp> #include <iostream> //#pragma comment(lib,"libboost_regex-vc90-mt-sgd-1_44.lib") int main() { std::string s = "wcdj gerry"; boost::regex expr("//w+//s//w+"); // [1] regex_match std::cout << boost::regex_match(s, expr) << std::endl;// 1 // [2] regex_search expr = "wcdj"; std::cout << boost::regex_search(s.begin(), s.end(), expr) << std::endl;// 1 expr = "(//w+)//s(//w+)"; boost::smatch what; if (boost::regex_search(s, what, expr)) { std::cout << what[0] << std::endl;// wcdj gerry std::cout << what[1] << " " << what[2] << std::endl; // wcdj gerry } // [3] regex_replace expr = "//s"; std::string fmt("_"); std::cout << boost::regex_replace(s, expr, fmt) << std::endl;// wcdj_gerry expr = "(//w+)//s(//w+)"; fmt = "//2 //1"; std::cout << boost::regex_replace(s, expr, fmt) << std::endl;// gerry wcdj // [4] /* boost::regex_constants::format_literal标志作为第四参数传递给函数boost::regex_replace(),从而抑制了格式参数中对特殊字符的处理 */ expr = "(//w+)//s(//w+)"; fmt = "//2 //1"; std::cout << boost::regex_replace(s, expr, fmt, boost::regex_constants::format_literal) << std::endl;// /2 /1 return 0; }

 

 

你可能感兴趣的:(String,正则表达式,search,存储,regex,Constants)