SigalHu

C++ STL之正则表达式

正则表达式是C++11标准库中新加入的强大工具。正则表达式是一种用于字符串处理的微型语言，适用于一些与字符串相关的操作。

C++11包含了对以下几种语法的支持：ECMAScript、basic、extended、awk、grep和egrep。C++11中使用的默认语法是ECMAScript。

匹配

regex_match

regex_match()算法可以用于比较一个给定源字符串和一个正则表达式模式，如果模式匹配整个源字符串，则返回true，否则返回false。

#include 
#include 
using namespace std;

int main() {
    string str = "sigalhu233";

    regex r("[a-z0-9]+");
    cout<<"正则表达式：[a-z0-9]+"<if(regex_match(str,r))
        cout<<"字符串："<" 匹配成功！"<else
        cout<<"字符串："<" 匹配失败！"<cout<"正则表达式：\\d+"<if(regex_match(str,regex("\\d+")))
        cout<<"字符串："<" 匹配成功！"<else
        cout<<"字符串："<" 匹配失败！"<cout<"正则表达式：\\d+"<if(regex_match(str.begin()+7,str.end(),regex("\\d+")))
        cout<<"字符串："<<&str[7]<<" 匹配成功！"<else
        cout<<"字符串："<<&str[7]<<" 匹配失败！"<cout<"正则表达式：([a-z]+)(\\d+)"<if(regex_match(str.cbegin()+5,str.cend(),sm,regex("([a-z]+)(\\d+)"))){
        cout<<"字符串："<<&str[5]<<" 匹配成功！"<cout<<"匹配字符串个数："<cout<<"分别为：";
        for(auto aa:sm)
            cout<" ";
        cout<else
        cout<<"字符串："<<&str[5]<<" 匹配失败！"<cout<"正则表达式：([a-z]+)(\\d+)"<if(regex_match(str.c_str(),cm,regex("([a-z]+)(\\d+)"))){
        cout<<"字符串："<" 匹配成功！"<cout<<"匹配字符串个数："<cout<<"分别为：";
        for(auto aa:cm)
            cout<" ";
        cout<else
        cout<<"字符串："<" 匹配失败！"<return 0;
}

运行结果：

正则表达式：[a-z0-9]+
字符串：sigalhu233 匹配成功！

正则表达式：\d+
字符串：sigalhu233 匹配失败！

正则表达式：\d+
字符串：233 匹配成功！

正则表达式：([a-z]+)(\d+)
字符串：hu233 匹配成功！
匹配字符串个数：3
分别为：hu233 hu 233

正则表达式：([a-z]+)(\d+)
字符串：sigalhu233 匹配成功！
匹配字符串个数：3
分别为：sigalhu233 sigalhu 233

查找

regex_search

regex_search()算法可以在输入字符串中提取匹配的子字符串。smatch对象sm将包含搜索结果。如果要获得第一个捕捉组的字符串表达形式，可在代码中编写m[1]或m[1].str()。通过查看m[1].first和m[1].second迭代器可以得到这个子字符串在源字符串中出现的准确位置。

#include 
#include 
using namespace std;

int main() {
    string str = "sigalhu233sigal233hu233";
    smatch sm;

    cout<<"正则表达式：([a-z]+)2"<for(auto it=str.cbegin();regex_search(it,str.cend(),sm,regex("([a-z]+)2"));it=sm.suffix().first){
        cout<<"字符串："<<&*it<<" 匹配成功！"<cout<<"匹配字符子串个数："<cout<<"分别为：";
        for(auto aa:sm)
            cout<" ";
        cout<cout<<"字符串 "<" 前的字符串为："<cout<<"字符串 "<" 后的字符串为："<cout<return 0;
}

运行结果：

正则表达式：([a-z]+)2
字符串：sigalhu233sigal233hu233 匹配成功！
匹配字符子串个数：2
分别为：sigalhu2 sigalhu
字符串 sigalhu2 前的字符串为：
字符串 sigalhu2 后的字符串为：33sigal233hu233

字符串：33sigal233hu233 匹配成功！
匹配字符子串个数：2
分别为：sigal2 sigal
字符串 sigal2 前的字符串为：33
字符串 sigal2 后的字符串为：33hu233

字符串：33hu233 匹配成功！
匹配字符子串个数：2
分别为：hu2 hu
字符串 hu2 前的字符串为：33
字符串 hu2 后的字符串为：33

regex_iterator

为了逐一迭代正则查找的所有匹配成果，我们也可以使用regex_iterator。一般情况下，需要为某个特定的容器指定一个尾迭代器，但是对于regex_iterator，只有一个end值。只需要通过默认的构造函数声明一个regex_iterator类型，就可以获得这个尾迭代器：这个尾迭代器会被隐式地初始化为end值。

#include 
#include 
using namespace std;

int main() {
    string str = "sigalhu233sigal233hu233";
    regex reg("([a-z]+)2");

    cout<<"正则表达式：([a-z]+)2"<for(sregex_iterator it(str.begin(),str.end(),reg),end;it != end;it++){
        cout<<"字符串："<<&*it->prefix().first<<" 匹配成功！"<cout<<"匹配字符子串个数："<size()<cout<<"分别为：";
        for(auto aa:*it)
            cout<" ";
        cout<cout<<"字符串 "<str()<<" 前的字符串为："<prefix().str()<cout<<"字符串 "<str()<<" 后的字符串为："<suffix().str()<cout<return 0;
}

运行结果：

正则表达式：([a-z]+)2
字符串：sigalhu233sigal233hu233 匹配成功！
匹配字符子串个数：2
分别为：sigalhu2 sigalhu
字符串 sigalhu2 前的字符串为：
字符串 sigalhu2 后的字符串为：33sigal233hu233

字符串：33sigal233hu233 匹配成功！
匹配字符子串个数：2
分别为：sigal2 sigal
字符串 sigal2 前的字符串为：33
字符串 sigal2 后的字符串为：33hu233

字符串：33hu233 匹配成功！
匹配字符子串个数：2
分别为：hu2 hu
字符串 hu2 前的字符串为：33
字符串 hu2 后的字符串为：33

regex_token_iterator

regex_iterator有助于迭代“匹配合格”的子序列。然而有时候你会想处理那些子序列之间的内容，特别是当你打算将string拆分为一个个语汇单元token或以某个东西分割string，分隔符甚至可能被指定为一个正则表达式。regex_token_iterator就提供了这样的功能。

为了将它初始化，需要传给它字符序列的起点和终点，以及一个正则表达式。此外还可以指明一列整数值，用来表示语汇化过程中的元素：
* -1：表示你对每一个“匹配之正则表达式之间”或“语汇切分器之间”的子序列感兴趣
* 0：表示你对每一个匹配之正则表达式或语汇切分器感兴趣
* 任何其他数字 n ：表示你对正则表达式中的第 n 个匹配次表达式感兴趣

#include 
#include 
using namespace std;

int main() {
    string str = "11sigalhu233sigal244hu255";
    regex reg("([a-z]+)2");

    cout<<"正则表达式：([a-z]+)2"<cout<<"字符串为："<for(sregex_token_iterator it(str.begin(),str.end(),reg),end;it != end;it++){
        cout<<"匹配到的字符串为："<str()<cout<for(sregex_token_iterator it(str.begin(),str.end(),reg,1),end;it != end;it++){
        cout<<"匹配到的字符串为："<str()<cout<for(sregex_token_iterator it(str.begin(),str.end(),reg,-1),end;it != end;it++){
        cout<<"匹配到的字符串为："<str()<cout<return 0;
}

运行结果：

正则表达式：([a-z]+)2
字符串为：11sigalhu233sigal244hu255
匹配到的字符串为：sigalhu2
匹配到的字符串为：sigal2
匹配到的字符串为：hu2

匹配到的字符串为：sigalhu
匹配到的字符串为：sigal
匹配到的字符串为：hu

匹配到的字符串为：11
匹配到的字符串为：33
匹配到的字符串为：44
匹配到的字符串为：55

替换

regex_replace

regex_replace()算法要求输入一个正则表达式，以及一个用于替换匹配子字符串的格式化字符串。这个格式化字符串可以通过转义序列引用匹配子字符串中的部分内容。

转义序列	替换为
$n	匹配第`n`个捕捉组的字符串。例如`$l`表示第一个捕捉组，`$2`表示第二个，依此类推
$&	匹配整个正则表达式的字符串，等同于`$0`
$`	在源字符串中，在匹配正则表达式的子字符串左侧的部分
$’	在源字符串中，在匹配正则表达式的子字符串右侧的部分
$$	美元符号

#include 
#include 
using namespace std;

int main() {
    string str = "11sigalhu22sigalhu33",str1;

    str1 = regex_replace(str,regex("s(igal)h(u)"),"SS$1HH$2");
    cout<"s(igal)h(u)"),"SS$1HH$2");
    cout<"123";
    regex_replace(str1.begin(),str.cbegin(),str.cend(),regex("s(igal)h(u)"),"SS$1HH$2");
    cout<"s(igal)h(u)"),"SS$1HH$2");
    cout<return 0;
}

运行结果：

11SSigalHHu22SSigalHHu33
11SSigalHHu22SSigalHHu3311SSigalHHu22SSigalHHu33
11S
11S11SSigalHHu22SSigalHHu33

你可能感兴趣的:(C++-STL)

C++-STL（1）-Vector-随机数（randon、default_random_engine）多云的夏天
STL标准模板库数据结构与算法分离，不是面向对象的。容器container包含两类序列和关联序列list双向链表O（n）任何位置上都快链表是内存地址不连续存的快vector动态数组头尾快中部慢数组是连续的取的快deques关联setmap索引取取的快本文讲vector的使用。随机数是用来测试的，顺便也给了两种方式(randon,default_random_engine）。1.Vector的基本操
C++-STL(18)-ctime-VS2019下的正解多云的夏天 C++
时间函数大家很熟了，但是发现在vs2019下，好用的ctime等函数编译不通过。何解？因为不安全，全部替换成类似于ctime_s这样的。上代码：编译不通过voidtest_time(){//1.程序启动时间clock_tclock_tstarttm=clock();//基于当前系统的当前日期/时间time_tnow=time(0);cout<<"1970到目前经过秒数:"<
C++-STL(4)-unordered_set-自定义类型-实例源码多云的夏天 C++
自定义类型一般有三种实现方式，百度一下就出来了。目的都是重写hash以及equal。其实都是三步走：1.自定义对象；2.重载operator;3,哈希函数本文给出两种好用的，一个是struct的，一个是class的。照着做肯定可以用起来。本文的struct和class成员变量都是基本数据类型，成员变量有自定义类型的参看1.structstructRect{intwidth;intheight;st
C++-STL：vector用法总结 Bylight
目录一、简介二、用法1.头文件2.vector的声明及初始化3.vector基本操作1）容量相关2）修改元素3）使用迭代器4）访问元素4.常用操作1）遍历元素2）元素翻转3）元素排序一、简介vector，是同一类型的对象的集合，这一集合可看作可变大小的数组，是容器的一种。对于容器来说，其重要特性之一便是于可以在运行时高效地添加元素。类似于数组，vector采用连续内存地址来存储元素，因此vecto
【用法详解】C++-STL 队列queue与优先队列priority_queue的用法详解与学习心得荷叶田田_ 学习笔记与用法总结
【C++-STL队列与优先队列用法详解】1、队列queuequeue模板类的定义在头文件中。与stack模板类很相似，queue模板类也需要两个模板参数，一个是元素类型，一个容器类型，元素类型是必要的，容器类型是可选的，默认为deque类型。定义queue对象的示例代码如下：queueq1;queueq2;queue的基本操作有：入队，如例：q.push(x);将x接到队列的末端。出队，如例：q.
c++-STL：删除子串 JasonHaven 数据结构和算法
voiddeletesub(string&str,conststring&sub,intn){intm,flag=0,num=0;//num是子串出现的次数while(flag==0){m=str.find(sub);//在str中找子串sub,返回起点下标if(m<0)//没找到flag=1;else{str.erase(m,n);//删除子串,起点和sub长度num++;}}cout<
java杨辉三角 3213213333332132 java基础
package com.algorithm; /** * @Description 杨辉三角 * @author FuJianyong * 2015-1-22上午10:10:59 */ public class YangHui { public static void main(String[] args) { //初始化二维数组长度 int[][] y
《大话重构》之大布局的辛酸历史白糖_ 重构
《大话重构》中提到“大布局你伤不起”，如果企图重构一个陈旧的大型系统是有非常大的风险，重构不是想象中那么简单。我目前所在公司正好对产品做了一次“大布局重构”，下面我就分享这个“大布局”项目经验给大家。背景公司专注于企业级管理产品软件，企业有大中小之分，在2000年初公司用JSP/Servlet开发了一套针对中
电驴链接在线视频播放源码 dubinwei 源码电驴播放器视频 ed2k
本项目是个搜索电驴（ed2k）链接的应用,借助于磁力视频播放器（官网： http://loveandroid.duapp.com/ 开放平台），可以实现在线播放视频，也可以用迅雷或者其他下载工具下载。项目源码： http://git.oschina.net/svo/Emule,动态更新。也可从附件中下载。项目源码依赖于两个库项目，库项目一链接： http://git.oschina.
Javascript中函数的toString()方法周凡杨 JavaScript js toString function object
简述 The toString() method returns a string representing the source code of the function. 简译之，Javascript的toString()方法返回一个代表函数源代码的字符串。句法 function.
struts处理自定义异常 g21121 struts
很多时候我们会用到自定义异常来表示特定的错误情况，自定义异常比较简单，只要分清是运行时异常还是非运行时异常即可，运行时异常不需要捕获，继承自RuntimeException，是由容器自己抛出，例如空指针异常。非运行时异常继承自Exception，在抛出后需要捕获，例如文件未找到异常。此处我们用的是非运行时异常，首先定义一个异常LoginException: /** * 类描述：登录相
Linux中find常见用法示例 510888780 linux
Linux中find常见用法示例 ·find path -option [ -print ] [ -exec -ok command ] {} \; find命令的参数；
SpringMVC的各种参数绑定方式 Harry642 springMVC 绑定表单
1. 基本数据类型(以int为例，其他类似)： Controller代码： @RequestMapping("saysth.do") public void test(int count) { } 表单代码： <form action="saysth.do" method="post&q
Java 获取Oracle ROWID aijuans java oracle
A ROWID is an identification tag unique for each row of an Oracle Database table. The ROWID can be thought of as a virtual column, containing the ID for each row. The oracle.sql.ROWID class i
java获取方法的参数名 antlove java jdk parameter method reflect
reflect.ClassInformationUtil.java package reflect; import javassist.ClassPool; import javassist.CtClass; import javassist.CtMethod; import javassist.Modifier; import javassist.bytecode.CodeAtt
JAVA正则表达式匹配查找替换提取操作百合不是茶 java 正则表达式替换提取查找
正则表达式的查找;主要是用到String类中的split(); String str; str.split();方法中传入按照什么规则截取,返回一个String数组常见的截取规则: str.split("\\.")按照.来截取 str.
Java中equals()与hashCode()方法详解 bijian1013 java set equals()hashCode()
一.equals()方法详解 equals()方法在object类中定义如下： public boolean equals(Object obj) { return (this == obj); } 很明显是对两个对象的地址值进行的比较（即比较引用是否相同）。但是我们知道，String 、Math、I
精通Oracle10编程SQL(4)使用SQL语句 bijian1013 oracle 数据库 plsql
--工资级别表 create table SALGRADE ( GRADE NUMBER(10), LOSAL NUMBER(10,2), HISAL NUMBER(10,2) ) insert into SALGRADE values(1,0,100); insert into SALGRADE values(2,100,200); inser
【Nginx二】Nginx作为静态文件HTTP服务器 bit1129 HTTP服务器
Nginx作为静态文件HTTP服务器在本地系统中创建/data/www目录，存放html文件(包括index.html) 创建/data/images目录，存放imags图片在主配置文件中添加http指令 http { server { listen 80; server_name
kafka获得最新partition offset blackproof kafka partition offset 最新
kafka获得partition下标，需要用到kafka的simpleconsumer import java.util.ArrayList; import java.util.Collections; import java.util.Date; import java.util.HashMap; import java.util.List; import java.
centos 7安装docker两种方式 ronin47
第一种是采用yum 方式 yum install -y docker
java-60-在O(1)时间删除链表结点 bylijinnan java
public class DeleteNode_O1_Time { /** * Q 60 在O(1)时间删除链表结点 * 给定链表的头指针和一个结点指针(!!)，在O(1)时间删除该结点 * * Assume the list is: * head->...->nodeToDelete->mNode->nNode->..
nginx利用proxy_cache来缓存文件 cfyme cache
user zhangy users; worker_processes 10; error_log /var/vlogs/nginx_error.log crit; pid /var/vlogs/nginx.pid; #Specifies the value for ma
[JWFD开源工作流]JWFD嵌入式语法分析器负号的使用问题 comsci 嵌入式
假如我们需要用JWFD的语法分析模块定义一个带负号的方程式，直接在方程式之前添加负号是不正确的，而必须这样做： string str01 = "a=3.14;b=2.71;c=0;c-((a*a)+(b*b))" 定义一个0整数c,然后用这个整数c去
如何集成支付宝官方文档 dai_lm android
官方文档下载地址 https://b.alipay.com/order/productDetail.htm?productId=2012120700377310&tabId=4#ps-tabinfo-hash 集成的必要条件 1. 需要有自己的Server接收支付宝的消息 2. 需要先制作app，然后提交支付宝审核，通过后才能集成调试的时候估计会真的扣款，请注意
应该在什么时候使用Hadoop datamachine hadoop
原帖地址：http://blog.chinaunix.net/uid-301743-id-3925358.html 存档，某些观点与我不谋而合，过度技术化不可取，且hadoop并非万能。 --------------------------------------------万能的分割线-------------------------------- 有人问我，“你在大数据和Hado
在GridView中对于有外键的字段使用关联模型进行搜索和排序 dcj3sjt126com yii
在GridView中使用关联模型进行搜索和排序首先我们有两个模型它们直接有关联: class Author extends CActiveRecord { ... } class Post extends CActiveRecord { ... function relations() { return array( '
使用NSString 的格式化大全 dcj3sjt126com Objective-C
格式定义The format specifiers supported by the NSString formatting methods and CFString formatting functions follow the IEEE printf specification; the specifiers are summarized in Table 1. Note that you c
使用activeX插件对象object滚动有重影蕃薯耀 activeX插件滚动有重影
使用activeX插件对象object滚动有重影 <object style="width:0;" id="abc" classid="CLSID:D3E3970F-2927-9680-BBB4-5D0889909DF6" codebase="activex/OAX339.CAB#
SpringMVC4零配置 hanqunfeng springmvc4
基于Servlet3.0规范和SpringMVC4注解式配置方式，实现零xml配置，弄了个小demo，供交流讨论。项目说明如下： 1.db.sql是项目中用到的表，数据库使用的是oracle11g 2.该项目使用mvn进行管理，私服为自搭建nexus,项目只用到一个第三方 jar，就是oracle的驱动； 3.默认项目为零配置启动，如果需要更改启动方式，请
《开源框架那点事儿16》：缓存相关代码的演变 j2eetop 开源框架
问题引入上次我参与某个大型项目的优化工作，由于系统要求有比较高的TPS，因此就免不了要使用缓冲。该项目中用的缓冲比较多，有MemCache，有Redis，有的还需要提供二级缓冲，也就是说应用服务器这层也可以设置一些缓冲。当然去看相关实现代代码的时候，大致是下面的样子。 [java] view plain copy print ? public vo
AngularJS浅析 kvhur JavaScript
概念 AngularJS is a structural framework for dynamic web apps. 了解更多详情请见原文链接：http://www.gbtags.com/gb/share/5726.htm Directive 扩展html，给html添加声明语句，以便实现自己的需求。对于页面中html元素以ng为前缀的属性名称，ng是angular的命名空间
架构师之jdk的bug排查(一)---------------split的点号陷阱 nannan408 split
1.前言. jdk1.6的lang包的split方法是有bug的,它不能有效识别A.b.c这种类型,导致截取长度始终是0.而对于其他字符,则无此问题.不知道官方有没有修复这个bug. 2.代码 String[] paths = "object.object2.prop11".split("'"); System.ou
如何对10亿数据量级的mongoDB作高效的全表扫描 quentinXXZ mongodb
本文链接: http://quentinXXZ.iteye.com/blog/2149440 一、正常情况下，不应该有这种需求首先，大家应该有个概念，标题中的这个问题，在大多情况下是一个伪命题，不应该被提出来。要知道，对于一般较大数据量的数据库，全表查询，这种操作一般情况下是不应该出现的，在做正常查询的时候，如果是范围查询，你至少应该要加上limit。说一下，
C语言算法之水仙花数 qiufeihu c 算法
/** * 水仙花数 */ #include <stdio.h> #define N 10 int main() { int x,y,z; for(x=1;x<=N;x++) for(y=0;y<=N;y++) for(z=0;z<=N;z++) if(x*100+y*10+z == x*x*x
JSP指令 wyzuomumu jsp
jsp指令的一般语法格式： <%@ 指令名属性 =”值 ” %> 常用的三种指令： page,include,taglib page指令语法形式： <%@ page 属性 1=”值 1” 属性 2=”值 2”%> include指令语法形式： <%@include file=”relative url”%> (jsp可以通过 include