1、初级(确定的子字符串)
当NSString中含有多个相同的子字符串,而又需要查询所有子字符串的位置时,单纯的使用rangeOfString就不好使了,例如
NSRange range = [@"你可以点击这里跳转,也可以点击这里跳转" rangeOfString@"跳转"];
只会得到第一个"跳转"的位置。
解决思路:循环,从主串第一个字符开始搜索,每次取出长度为子串长度的字符串,如果取出的串与子串的文字一致,存进数组里,最后,数组里会存放所有的range
代码如下:
- (NSArray*)rangeOfSubString:(NSString*)subStr inString:(NSString*)string {
NSMutableArray *rangeArray = [NSMutableArray array];
NSString*string1 = [string stringByAppendingString:subStr];
NSString *temp;
for(int i =0; i < string.length; i ++) {
temp = [string1substringWithRange:NSMakeRange(i, subStr.length)];
if ([temp isEqualToString:subStr]) {
NSRange range = {i,subStr.length};
[rangeArray addObject: [NSValue valueWithRange:range]];
}
}
return rangeArray;
}
备注:得到返回的数组后,取出来的元素是NSValue,需要转换成NSRange使用
NSRange range = [value rangeValue];
2、高级(正则表达式匹配主串中所有符合条件的子串,并获得所有子串的文字和位置)
例如,我需要获得主字符串中的网页链接,需要得到这段链接的text(文字)和range(位置),如果主串中只有一个链接,可以这样获得
NSString *mainString = @"这里有一个链接www.baidu.com";
NSString *regex =@"((http[s]{0,1}|ftp)://[a-zA-Z0-9\\.\\-]+\\.([a-zA-Z]{2,4})(:\\d+)?(/[a-zA-Z0-9\\.\\-~!@#$%^&*+?:_/=<>]*)?)|(www.[a-zA-Z0-9\\.\\-]+\\.([a-zA-Z]{2,4})(:\\d+)?(/[a-zA-Z0-9\\.\\-~!@#$%^&*+?:_/=<>]*)?)";//正则表达式
NSRange range = [mainString rangeOfString:regex options:NSRegularExpressionSearch];
NSString *subString = [mainString substringWithRange:range];
但是,如果主串中有多个链接,这种写法只会获得到第一个。
2.1、方法一-原生方法
利用NSRegularExpression处理,直接上代码
NSString *initialText = @"这里有个链接http://www.baidu.com那里也有个链接www.sina.com最后还有个链接www.taobao.com";
//第一个参数填正则表达式
NSRegularExpression *regex = [NSRegularExpression regularExpressionWithPattern:@"((http[s]{0,1}|ftp)://[a-zA-Z0-9\\.\\-]+\\.([a-zA-Z]{2,4})(:\\d+)?(/[a-zA-Z0-9\\.\\-~!@#$%^&*+?:_/=<>]*)?)|(www.[a-zA-Z0-9\\.\\-]+\\.([a-zA-Z]{2,4})(:\\d+)?(/[a-zA-Z0-9\\.\\-~!@#$%^&*+?:_/=<>]*)?)" options:0 error:nil];
NSArray *matches = [regex matchesInString:initialText options:0 range:NSMakeRange(0,initialText.length)];
for(NSTextCheckingResult *result in [matches objectEnumerator]) {
NSRangematch Range = [result range];
NSLog(@"%@",NSStringFromRange(matchRange));
}
这样可以获得所有的range,通过range再去截取想要的字符串
2.2、方法二-自定义算法
解决思路:循环,搜索到第一个之后,先把第一个的信息打包成字典存进数组,再次搜索,把上次的信息字典取出来,根据上一个位置信息,把主串截取为在那之后的串,记录新串的头字符在主串中的位置,在新串中再次搜索,搜索到的range的location需要加上新串的头字符在主串中的位置,打包信息存进数组,再次搜索,直到搜索不到信息。
代码如下:
- (void)searchAllTextRangeWithInitialArray:(NSMutableArray*)initialArray initialText:(NSString*)initialText regexString:(NSString*)regexString{
if (initialArray.count == 0) {//如果此时传入的array是空
NSRange range = [initialText rangeOfString:regexString options:NSRegularExpressionSearch];
if (range.location != NSNotFound) {
//包装字典,存进数组
NSMutableDictionary *dict = [NSMutableDictionary dictionary];
dict[@"subString"] = [initialText substringWithRange:range];
dict[@"subStringRange"] = [NSValue valueWithRange:range];
[initialArray addObject:dict];
//递归调用
[self searchAllTextRangeWithInitialArray:initialArray initialText:initialText regexString:regexString];
}else{
return;
}
}else{//如果数组中已经有值了
//1、取数组中最后一个字典,记录后串在原串中的起始位置,把该串及其之前的串去掉生成新串
NSMutableDictionary *lastDict = [initialArray lastObject];
NSRangelastRange = [lastDict[@"subStringRange"]rangeValue];
NSUIntegernewStringBeginLocation = lastRange.location+ lastRange.length;
NSString*newString = [initialTextsubstringFromIndex:newStringBeginLocation];
//2、在新串中找符合的子串,如果找到,包装存进数组
NSRange rangeInNewString = [newString rangeOfString:regexString options:NSRegularExpressionSearch];
if(rangeInNewString.location!=NSNotFound) {
//包装字典,存进数组
NSMutableDictionary*dict = [NSMutableDictionary dictionary];
dict[@"subString"] = [newString substringWithRange:rangeInNewString];
NSRange rangeIninitialText = NSMakeRange(rangeInNewString.location+newStringBeginLocation, rangeInNewString.length);
dict[@"subStringRange"] = [NSValue valueWithRange:rangeIninitialText];
[initialArray addObject:dict];
//递归调用
[self searchAllTextRangeWithInitialArray:initialArray initialText:initialText regexString:regexString];
}else{
return;
}
}
}
使用示例:
NSString *initialText = @"这里有个链接http://www.baidu.com那里也有个链接www.sina.com最后还有个链接www.taobao.com";
NSString *regex = @"((http[s]{0,1}|ftp)://[a-zA-Z0-9\\.\\-]+\\.([a-zA-Z]{2,4})(:\\d+)?(/[a-zA-Z0-9\\.\\-~!@#$%^&*+?:_/=<>]*)?)|(www.[a-zA-Z0-9\\.\\-]+\\.([a-zA-Z]{2,4})(:\\d+)?(/[a-zA-Z0-9\\.\\-~!@#$%^&*+?:_/=<>]*)?)";//正则表达式
NSMutableArray*array = [NSMutableArray array];
[self searchAllTextRangeWithInitialArray:array initialText:initialText regexString:regex];
if(array.count==0) {
NSLog(@"查询失败");
}else{
NSLog(@"查询成功");
}
//此时,如果有对应的匹配项,数组中已经存好对应的字典了
备注:
1、array中存的是N个字典,每个字典中存了两个值:子串、子串位置,结构如下图
2、字典中的range是NSValue,需要转换成NSRange使用
(
{
subString = "http://www.baidu.com";
subStringRange = "NSRange: {6, 20}";
},
{
subString = "www.sina.com";
subStringRange = "NSRange: {33, 12}";
},
{
subString = "www.taobao.com";
subStringRange = "NSRange: {52, 14}";
}
)
PS:
1、上文中的是在网上找到的匹配一段文字中的链接的正则表达式,亲测好用!如果需要匹配一段文字中的电话号码、邮箱等,可以询问度娘相关的表达式;
2、喜欢可以点个赞哦!转载请说明出处,谢谢!