好吧,一下博文转自:http://www.tuicool.com/articles/Qnmu6f
对xml进行解析的标准有两种:sax以及dom。
首先这两种标准并不是针对java的,他们在各种语言环境下都可以实现。dom是真正的国际标准。sax是事实的标准,它不由任何商业组织维 护,而是由一个非商业的组织在运作。就像iso7层模型和tcp/ip一样,虽然sax不是正式的标准,但是一点不影响其在xml解析领域的地位。
dom实现的原理是把整个xml文档一次性读出,放在一个树型结构里。在需要的时候,查找特定节点,然后对节点进行读或写。它的主要优势是实现简单,读写平衡;缺点是比较占内存,因为他要把整个xml文档都读入内存,文件越大,这种缺点就越明显。
sax的实现方法和dom不同。
SAX解析XML,是基于事件通知的模式,一边读取XML文档一边处理,不必等整个文档加载完之后才采取操作,当在读取解析过程中遇到需要处理的对象,会发出通知对其进行处理。由于该方法 只在xml文档中查找特定条件的内容,并且只提取需要的内容。这样做占用内存小,灵活,正好满足我们的需求。
在iOS中,可以通过NSXMLParser实现sax方法解析xml文件。
对于NSXMLParser,常用的初始化方法有两种:通过XML的URL初始化和通过本地的XML文件初始化。
1.使用NSXMLParser解析XML网址数据
首先给出一个XML资源网址: http://rss.sina.com.cn/tech/index.shtml ,也就是新浪新闻频道列表,可以用来练习解析XML数据。
使用NSXMLParser解析XML数据的关键是实现NSXMLParserDelegate中的方法:
#pragma mark -
#pragma mark NSXMLParserDelegate /* 开始解析xml文件,在开始解析xml节点前,通过该方法可以做一些初始化工作 */ - (void)parserDidStartDocument:(NSXMLParser *)parser { NSLog(@"开始解析xml文件"); } /* 当解析器对象遇到xml的开始标记时,调用这个方法开始解析该节点 */ - (void)parser:(NSXMLParser *)parser didStartElement:(NSString *)elementName namespaceURI:(NSString *)namespaceURI qualifiedName:(NSString *)qName attributes:(NSDictionary *)attributeDict { NSLog(@"发现节点"); } /* 当解析器找到开始标记和结束标记之间的字符时,调用这个方法解析当前节点的所有字符 */ - (void)parser:(NSXMLParser *)parser foundCharacters:(NSString *)string { NSLog(@"正在解析节点内容"); } /* 当解析器对象遇到xml的结束标记时,调用这个方法完成解析该节点 */ - (void)parser:(NSXMLParser *)parser didEndElement:(NSString *)elementName namespaceURI:(NSString *)namespaceURI qualifiedName:(NSString *)qName { NSLog(@"解析节点结束"); } /* 解析xml出错的处理方法 */ - (void)parser:(NSXMLParser *)parser parseErrorOccurred:(NSError *)parseError { NSLog(@"解析xml出错:%@", parseError); } /* 解析xml文件结束 */ - (void)parserDidEndDocument:(NSXMLParser *)parser { NSLog(@"解析xml文件结束"); }
在这里我选择了 view-source:http://rss.sina.com.cn/news/allnews/tech.xml 进行解析。
其中一项内容是:
<item> <title> <![CDATA[苹果设计主管艾维:设计最重要的是全心投入]]> </title> <link>http://go.rss.sina.com.cn/redirect.php?url=http://tech.sina.com.cn/it/2013-10-11/14588806471.shtml</link> <author>SINA.com</author> <guid>http://go.rss.sina.com.cn/redirect.php?url=http://tech.sina.com.cn/it/2013-10-11/14588806471.shtml</guid> <category> <![CDATA[科技新闻]]> </category> <pubDate>Fri, 11 Oct 2013 06:58:40 GMT</pubDate> <comments></comments> <description> <![CDATA[ 新浪科技讯 北京时间10月11日下午消息,苹果首席设计师乔尼・艾维(Jony Ive)接受媒体采访时表示,设计产品的过程中最重要的是要真心重视这项工作,付出自己最大的努力。而且要加强与各种材料的亲身接触,不能过度依赖电脑建模。 “在对待人们不会立刻发现的事情时,我....]]> </description> </item>
在这里要解析的是新闻的标题title,摘要description,发布时间pubDate。
首先声明三个数组来存储这些新闻内容:
static NSString *xmlURLString = @"http://rss.sina.com.cn/news/allnews/tech.xml"; // 要解析的XML网址 @interface ViewController () <NSXMLParserDelegate> @property (nonatomic, strong) NSMutableArray *newsTitles; // 标题 @property (nonatomic, strong) NSMutableArray *newsDescription; // 摘要 @property (nonatomic, strong) NSMutableArray *newsPublicDates; // 发布时间 @property (nonatomic, strong) NSMutableString *tempString; // 用于临时保存解析的字符数据 @property (nonatomic, strong) NSXMLParser *xmlParser; // XML解析器 @end
看看程序的界面:
有一个spinner_view用来指示正在解析xml数据,parse按钮按下后开始解析xml数据,showxml_textView用于显示解析后的新闻内容。
在按下parse按钮后,对解析器进行初始化并启动解析:
- (IBAction)parseXML:(id)sender { xmlParser = [[NSXMLParser alloc] initWithContentsOfURL:[NSURL URLWithString:xmlURLString]]; xmlParser.delegate = self; [xmlParser parse]; }
必须要设置解析器的委托为自己。
在parse方法调用后,将触发NSXMLParser中的方法,开始进行XML解析工作:
#pragma mark - #pragma mark NSXMLParserDelegate /* 开始解析xml文件,在开始解析xml节点前,通过该方法可以做一些初始化工作 */ - (void)parserDidStartDocument:(NSXMLParser *)parser { [spinner_view startAnimating]; newsTitles = nil; newsDescription = nil; newsPublicDates = nil; tempString = nil; showxml_textView.text = @""; NSLog(@"开始解析xml文件"); } /* 当解析器对象遇到xml的开始标记时,调用这个方法开始解析该节点 */ - (void)parser:(NSXMLParser *)parser didStartElement:(NSString *)elementName namespaceURI:(NSString *)namespaceURI qualifiedName:(NSString *)qName attributes:(NSDictionary *)attributeDict { NSLog(@"发现节点"); if([elementName isEqualToString:@"title"]) { if(newsTitles == nil) newsTitles = [[NSMutableArray alloc] init]; } else if([elementName isEqualToString:@"description"]) { if(newsDescription == nil) newsDescription = [[NSMutableArray alloc] init]; } else if([elementName isEqualToString:@"pubDate"]) { if(newsPublicDates == nil) newsPublicDates = [[NSMutableArray alloc] init]; } else { } } /* 当解析器找到开始标记和结束标记之间的字符时,调用这个方法解析当前节点的所有字符 */ - (void)parser:(NSXMLParser *)parser foundCharacters:(NSString *)string { NSLog(@"正在解析节点内容"); if(self.tempString == nil) self.tempString = [[NSMutableString alloc] init]; [self.tempString appendString:string]; } /* 当解析器对象遇到xml的结束标记时,调用这个方法完成解析该节点 */ - (void)parser:(NSXMLParser *)parser didEndElement:(NSString *)elementName namespaceURI:(NSString *)namespaceURI qualifiedName:(NSString *)qName { NSLog(@"解析节点结束"); if([elementName isEqualToString:@"title"]) { [newsTitles addObject:self.tempString]; } else if([elementName isEqualToString:@"description"]) { [newsDescription addObject:self.tempString]; } else if([elementName isEqualToString:@"pubDate"]) { [newsPublicDates addObject:self.tempString]; } else { } self.tempString = nil; } /* 解析xml出错的处理方法 */ - (void)parser:(NSXMLParser *)parser parseErrorOccurred:(NSError *)parseError { NSLog(@"解析xml出错:%@", parseError); } /* 解析xml文件结束 */ - (void)parserDidEndDocument:(NSXMLParser *)parser { if (!tempString) { tempString = [[NSMutableString alloc] init]; } for (int i = 2; i < 10; i++) { [tempString appendString:newsTitles[i + 1]]; [tempString appendString:newsDescription[i]]; [tempString appendString:newsPublicDates[i]]; [tempString appendString:@"\n------------------------------------------------"]; } showxml_textView.text = tempString; NSLog(@"解析xml文件结束"); [spinner_view stopAnimating]; }
简单说一说该解析过程:
(1)在parse方法调用后,受委托的类首先调用委托中的
/* 开始解析xml文件,在开始解析xml节点前,通过该方法可以做一些初始化工作 */
- (void)parserDidStartDocument:(NSXMLParser *)parser
方法进行一些初始化工作,比如清空保存新闻内容的数组,对界面内容操作等。
(2)在解析过程中,如果遇到xml开始标记,表明已经遇到了一个xml节点,此时将调用委托中的
/* 当解析器对象遇到xml的开始标记时,调用这个方法开始解析该节点 */
- (void)parser:(NSXMLParser *)parser didStartElement:(NSString *)elementName namespaceURI:(NSString *)namespaceURI qualifiedName:(NSString *)qName attributes:(NSDictionary *)attributeDict
方法开始解析这个节点。
这个时候,应该对存储节点的数组进行初始化工作。
(3)在解析节点时,将调用委托中的
/* 当解析器找到开始标记和结束标记之间的字符时,调用这个方法解析当前节点的所有字符 */
- (void)parser:(NSXMLParser *)parser foundCharacters:(NSString *)string
方法解析该节点中的所有字符。此时可以用一个tempString变量保存其中的字符内容。
(4)在遇到一个xml结束标记后,表明解析该xml节点结束,此时可以调用
/* 当解析器对象遇到xml的结束标记时,调用这个方法完成解析该节点 */
- (void)parser:(NSXMLParser *)parser didEndElement:(NSString *)elementName namespaceURI:(NSString *)namespaceURI qualifiedName:(NSString *)qName
完成解析后的工作,例如将解析得到的结果存入数组中。
(5)如果解析出错,将调用
/* 解析xml出错的处理方法 */
- (void)parser:(NSXMLParser *)parser parseErrorOccurred:(NSError *)parseError { NSLog(@"解析xml出错:%@", parseError); }
进行出错处理。
(6)如果解析没有出错,也就是在成功解析整个XML文件后,将调用
/* 解析xml文件成功 */
- (void)parserDidEndDocument:(NSXMLParser *)parser
在该方法中可以使用xml解析后的完整数据。
运行结果:
2.使用NSXMLParser解析本地的XML文件
可以在Xcode中新建一个RTF文件,然后将XML中的文字内容粘贴到该文件中,例如:
<?xml version="1.0" encoding="UTF-8"?>
<Data> <Movie> <title>good lucky to you</title> <box>111</box> <summary>This is a story</summary> </Movie> <Movie> <title>hello</title> <box>99</box> <summary>oh,yes</summary> </Movie> <Movie> <title>Cold</title> <box>100</box> <summary>I love cold weather</summary> </Movie> </Data>
最后将rtf后缀改为xml就可以了。
如果修改xml文件中的内容,比如去掉一个</summary>,那么在解析xml文件时将会出错,例如:
2013-10-11 16:46:27.777 XMLParserDemo[5636:a0b] 解析xml出错:Error Domain=NSXMLParserErrorDomain Code=76 "The operation couldn’t be completed. (NSXMLParserErrorDomain error 76.)" UserInfo=0x8c40f70 {NSXMLParserErrorLineNumber=20, NSXMLParserErrorColumn=13, NSXMLParserErrorMessage=Opening and ending tag mismatch: summary line 0 and Movie }
此时,程序将调用出错处理方法
/* 解析xml出错的处理方法 */
- (void)parser:(NSXMLParser *)parser parseErrorOccurred:(NSError *)parseError { NSLog(@"解析xml出错:%@", parseError); }
但最终不会调用
- (void)parserDidEndDocument:(NSXMLParser *)parser
也就是说,只有解析xml成功,才会有parserDidEndDocument:方法的调用。
和解析xml的url数据唯一不同的是解析器的初始化方法不同,这里的是:
- (IBAction)parseXML:(id)sender {
// xmlParser = [[NSXMLParser alloc] initWithContentsOfURL:[NSURL URLWithString:xmlURLString]];
NSString *path = [[NSBundle mainBundle] pathForResource:@"xml" ofType:@"xml"]; // 找到文件路径 NSFileHandle *file = [NSFileHandle fileHandleForReadingAtPath:path]; // 创建文件处理器 NSData *data = [file readDataToEndOfFile]; // 读取文件中的二进制数据 [file closeFile]; // 关闭文件 xmlParser = [[NSXMLParser alloc] initWithData:data]; // 通过文件中的二进制数据初始化xml解析器 xmlParser.delegate = self; // 设置委托 [xmlParser parse]; // 开始转换 }
对于解析url的xml数据的解析器初始化方法为:
xmlParser = [[NSXMLParser alloc] initWithContentsOfURL:[NSURL URLWithString:xmlURLString]];
解析本地xml文件的解析器的初始化方法为:
NSFileHandle *file = [ NSFileHandle fileHandleForReadingAtPath :path]; // 创建文件处理器
NSData *data = [file readDataToEndOfFile ]; // 读取文件中的二进制数据
xmlParser = [[ NSXMLParser alloc ] initWithData :data]; // 通过文件中的二进制数据初始化 xml 解析器
其解析过程是一样的,只是修改一下各个节点的节点名就可以了。