使用NSXMLParser解析XML数据

对xml进行解析的标准有两种:sax以及dom。
首先这两种标准并不是针对java的,他们在各种语言环境下都可以实现。dom是真正的国际标准。sax是事实的标准,它不由任何商业组织维 护,而是由一个非商业的组织在运作。就像iso7层模型和tcp/ip一样,虽然sax不是正式的标准,但是一点不影响其在xml解析领域的地位。
 
dom实现的原理是把整个xml文档一次性读出,放在一个树型结构里。在需要的时候,查找特定节点,然后对节点进行读或写。它的主要优势是实现简单,读写平衡;缺点是比较占内存,因为他要把整个xml文档都读入内存,文件越大,这种缺点就越明显。
 
sax的实现方法和dom不同。
SAX解析XML,是基于事件通知的模式,一边读取XML文档一边处理,不必等整个文档加载完之后才采取操作,当在读取解析过程中遇到需要处理的对象,会发出通知对其进行处理。由于该方法 只在xml文档中查找特定条件的内容,并且只提取需要的内容。这样做占用内存小,灵活,正好满足我们的需求。
 

在iOS中,可以通过NSXMLParser实现sax方法解析xml文件。

对于NSXMLParser,常用的初始化方法有两种:通过XML的URL初始化和通过本地的XML文件初始化。

1.使用NSXMLParser解析XML网址数据

首先给出一个XML资源网址:http://rss.sina.com.cn/tech/index.shtml,也就是新浪新闻频道列表,可以用来练习解析XML数据。

使用NSXMLParser解析XML数据的关键是实现NSXMLParserDelegate中的方法:

#pragma mark -
#pragma mark NSXMLParserDelegate

/* 开始解析xml文件,在开始解析xml节点前,通过该方法可以做一些初始化工作 */
- (void)parserDidStartDocument:(NSXMLParser *)parser
{
    NSLog(@"开始解析xml文件");
}

/* 当解析器对象遇到xml的开始标记时,调用这个方法开始解析该节点 */
- (void)parser:(NSXMLParser *)parser didStartElement:(NSString *)elementName namespaceURI:(NSString *)namespaceURI qualifiedName:(NSString *)qName
attributes:(NSDictionary *)attributeDict
{
    NSLog(@"发现节点");
}

/* 当解析器找到开始标记和结束标记之间的字符时,调用这个方法解析当前节点的所有字符 */
- (void)parser:(NSXMLParser *)parser foundCharacters:(NSString *)string
{
    NSLog(@"正在解析节点内容");
}

/* 当解析器对象遇到xml的结束标记时,调用这个方法完成解析该节点 */
- (void)parser:(NSXMLParser *)parser didEndElement:(NSString *)elementName namespaceURI:(NSString *)namespaceURI qualifiedName:(NSString *)qName
{
    NSLog(@"解析节点结束");
}

/* 解析xml出错的处理方法 */
- (void)parser:(NSXMLParser *)parser parseErrorOccurred:(NSError *)parseError
{
    NSLog(@"解析xml出错:%@", parseError);
}

/* 解析xml文件结束 */
- (void)parserDidEndDocument:(NSXMLParser *)parser
{
    NSLog(@"解析xml文件结束");
}

在这里我选择了view-source:http://rss.sina.com.cn/news/allnews/tech.xml进行解析。

其中一项内容是:

		<item>
			<title>
				<![CDATA[苹果设计主管艾维:设计最重要的是全心投入]]>
			</title>
			<link>http://go.rss.sina.com.cn/redirect.php?url=http://tech.sina.com.cn/it/2013-10-11/14588806471.shtml</link>
			<author>SINA.com</author>
			<guid>http://go.rss.sina.com.cn/redirect.php?url=http://tech.sina.com.cn/it/2013-10-11/14588806471.shtml</guid>
			<category>
				<![CDATA[科技新闻]]>
			</category>
			<pubDate>Fri, 11 Oct 2013 06:58:40 GMT</pubDate>
			<comments></comments>
			<description>
				<![CDATA[  新浪科技讯 北京时间10月11日下午消息,苹果首席设计师乔尼・艾维(Jony Ive)接受媒体采访时表示,设计产品的过程中最重要的是要真心重视这项工作,付出自己最大的努力。而且要加强与各种材料的亲身接触,不能过度依赖电脑建模。

  “在对待人们不会立刻发现的事情时,我....]]>
			</description>
		</item>




在这里要解析的是新闻的标题title,摘要description,发布时间pubDate。

首先声明三个数组来存储这些新闻内容:

static NSString *xmlURLString = @"http://rss.sina.com.cn/news/allnews/tech.xml"; // 要解析的XML网址

@interface ViewController () <NSXMLParserDelegate>
@property (nonatomic, strong) NSMutableArray *newsTitles;      // 标题
@property (nonatomic, strong) NSMutableArray *newsDescription; // 摘要
@property (nonatomic, strong) NSMutableArray *newsPublicDates; // 发布时间
@property (nonatomic, strong) NSMutableString *tempString;     // 用于临时保存解析的字符数据
@property (nonatomic, strong) NSXMLParser *xmlParser; // XML解析器
@end

看看程序的界面:

使用NSXMLParser解析XML数据_第1张图片

有一个spinner_view用来指示正在解析xml数据,parse按钮按下后开始解析xml数据,showxml_textView用于显示解析后的新闻内容。

在按下parse按钮后,对解析器进行初始化并启动解析:

- (IBAction)parseXML:(id)sender {
    xmlParser = [[NSXMLParser alloc] initWithContentsOfURL:[NSURL URLWithString:xmlURLString]];
     xmlParser.delegate = self;
    [xmlParser parse];
}
必须要设置解析器的委托为自己。

在parse方法调用后,将触发NSXMLParser中的方法,开始进行XML解析工作:

#pragma mark -
#pragma mark NSXMLParserDelegate

/* 开始解析xml文件,在开始解析xml节点前,通过该方法可以做一些初始化工作 */
- (void)parserDidStartDocument:(NSXMLParser *)parser
{
    [spinner_view startAnimating];
    newsTitles = nil;
    newsDescription = nil;
    newsPublicDates = nil;
    tempString = nil;
    showxml_textView.text = @"";
    NSLog(@"开始解析xml文件");
}

/* 当解析器对象遇到xml的开始标记时,调用这个方法开始解析该节点 */
- (void)parser:(NSXMLParser *)parser didStartElement:(NSString *)elementName namespaceURI:(NSString *)namespaceURI qualifiedName:(NSString *)qName
   attributes:(NSDictionary *)attributeDict
{
    
    NSLog(@"发现节点");
    if([elementName isEqualToString:@"title"])
    {
        if(newsTitles == nil)
            newsTitles = [[NSMutableArray alloc] init];
    }
    else if([elementName isEqualToString:@"description"])
    {
        if(newsDescription == nil)
            newsDescription = [[NSMutableArray alloc] init];
    }
    else if([elementName isEqualToString:@"pubDate"])
    {
        if(newsPublicDates == nil)
            newsPublicDates = [[NSMutableArray alloc] init];
    }
    else {
        
    }
}

/* 当解析器找到开始标记和结束标记之间的字符时,调用这个方法解析当前节点的所有字符 */
- (void)parser:(NSXMLParser *)parser foundCharacters:(NSString *)string
{
    NSLog(@"正在解析节点内容");
    if(self.tempString == nil)
        self.tempString = [[NSMutableString alloc] init];
    [self.tempString appendString:string];
}

/* 当解析器对象遇到xml的结束标记时,调用这个方法完成解析该节点 */
- (void)parser:(NSXMLParser *)parser didEndElement:(NSString *)elementName namespaceURI:(NSString *)namespaceURI qualifiedName:(NSString *)qName
{
    NSLog(@"解析节点结束");
    if([elementName isEqualToString:@"title"])
    {
        [newsTitles addObject:self.tempString];
    }
    else if([elementName isEqualToString:@"description"])
    {
        [newsDescription addObject:self.tempString];
    }
    else if([elementName isEqualToString:@"pubDate"])
    {
        [newsPublicDates addObject:self.tempString];
    }
    else {
        
    }
    self.tempString = nil;
}

/* 解析xml出错的处理方法 */
- (void)parser:(NSXMLParser *)parser parseErrorOccurred:(NSError *)parseError {
    NSLog(@"解析xml出错:%@", parseError);
}

/* 解析xml文件结束 */
- (void)parserDidEndDocument:(NSXMLParser *)parser
{
    if (!tempString) {
        tempString = [[NSMutableString alloc] init];
    }
    for (int i = 2; i < 10; i++) {
        [tempString appendString:newsTitles[i + 1]];
        [tempString appendString:newsDescription[i]];
        [tempString appendString:newsPublicDates[i]];
        [tempString appendString:@"\n------------------------------------------------"];
    }
    
    showxml_textView.text = tempString;
    NSLog(@"解析xml文件结束");
    [spinner_view stopAnimating];
}


简单说一说该解析过程:

(1)在parse方法调用后,受委托的类首先调用委托中的

/* 开始解析xml文件,在开始解析xml节点前,通过该方法可以做一些初始化工作 */
- (void)parserDidStartDocument:(NSXMLParser *)parser
方法进行一些初始化工作,比如清空保存新闻内容的数组,对界面内容操作等。

(2)在解析过程中,如果遇到xml开始标记,表明已经遇到了一个xml节点,此时将调用委托中的

/* 当解析器对象遇到xml的开始标记时,调用这个方法开始解析该节点 */
- (void)parser:(NSXMLParser *)parser didStartElement:(NSString *)elementName namespaceURI:(NSString *)namespaceURI qualifiedName:(NSString *)qName
   attributes:(NSDictionary *)attributeDict
方法开始解析这个节点。

这个时候,应该对存储节点的数组进行初始化工作。
(3)在解析节点时,将调用委托中的

/* 当解析器找到开始标记和结束标记之间的字符时,调用这个方法解析当前节点的所有字符 */
- (void)parser:(NSXMLParser *)parser foundCharacters:(NSString *)string
方法解析该节点中的所有字符。此时可以用一个tempString变量保存其中的字符内容。
(4)在遇到一个xml结束标记后,表明解析该xml节点结束,此时可以调用

/* 当解析器对象遇到xml的结束标记时,调用这个方法完成解析该节点 */
- (void)parser:(NSXMLParser *)parser didEndElement:(NSString *)elementName namespaceURI:(NSString *)namespaceURI qualifiedName:(NSString *)qName
完成解析后的工作,例如将解析得到的结果存入数组中。

(5)如果解析出错,将调用

/* 解析xml出错的处理方法 */
- (void)parser:(NSXMLParser *)parser parseErrorOccurred:(NSError *)parseError {
    NSLog(@"解析xml出错:%@", parseError);
}
进行出错处理。

(6)如果解析没有出错,也就是在成功解析整个XML文件后,将调用

/* 解析xml文件成功 */
- (void)parserDidEndDocument:(NSXMLParser *)parser
在该方法中可以使用xml解析后的完整数据。

运行结果:

使用NSXMLParser解析XML数据_第2张图片


2.使用NSXMLParser解析本地的XML文件

可以在Xcode中新建一个RTF文件,然后将XML中的文字内容粘贴到该文件中,例如:

<?xml version="1.0" encoding="UTF-8"?>

<Data>
     <Movie>
           <title>good lucky to you</title>
           <box>111</box>
           <summary>This is a story</summary>
     </Movie>

     <Movie>
           <title>hello</title>
           <box>99</box>
           <summary>oh,yes</summary>
    </Movie>
       
    <Movie>
          <title>Cold</title>
          <box>100</box>
          <summary>I love cold weather</summary>
    </Movie>
</Data>

最后将rtf后缀改为xml就可以了。


如果修改xml文件中的内容,比如去掉一个</summary>,那么在解析xml文件时将会出错,例如:

2013-10-11 16:46:27.777 XMLParserDemo[5636:a0b] 解析xml出错:Error Domain=NSXMLParserErrorDomain Code=76 "The operation couldn’t be completed. (NSXMLParserErrorDomain error 76.)" UserInfo=0x8c40f70 {NSXMLParserErrorLineNumber=20, NSXMLParserErrorColumn=13, NSXMLParserErrorMessage=Opening and ending tag mismatch: summary line 0 and Movie
}
此时,程序将调用出错处理方法

/* 解析xml出错的处理方法 */
- (void)parser:(NSXMLParser *)parser parseErrorOccurred:(NSError *)parseError {
    NSLog(@"解析xml出错:%@", parseError);
}
但最终不会调用

- (void)parserDidEndDocument:(NSXMLParser *)parser
也就是说,只有解析xml成功,才会有parserDidEndDocument:方法的调用。



和解析xml的url数据唯一不同的是解析器的初始化方法不同,这里的是:

- (IBAction)parseXML:(id)sender {
    // xmlParser = [[NSXMLParser alloc] initWithContentsOfURL:[NSURL URLWithString:xmlURLString]];
    NSString *path = [[NSBundle mainBundle] pathForResource:@"xml" ofType:@"xml"]; // 找到文件路径
    NSFileHandle *file = [NSFileHandle fileHandleForReadingAtPath:path]; // 创建文件处理器
    NSData *data = [file readDataToEndOfFile]; // 读取文件中的二进制数据
    [file closeFile]; // 关闭文件
    xmlParser = [[NSXMLParser alloc] initWithData:data]; // 通过文件中的二进制数据初始化xml解析器
     xmlParser.delegate = self; // 设置委托
    [xmlParser parse]; // 开始转换
}

对于解析url的xml数据的解析器初始化方法为:

xmlParser = [[NSXMLParser alloc] initWithContentsOfURL:[NSURL URLWithString:xmlURLString]];

解析本地xml文件的解析器的初始化方法为:

NSFileHandle *file = [NSFileHandlefileHandleForReadingAtPath:path];//创建文件处理器

NSData *data = [filereadDataToEndOfFile];//读取文件中的二进制数据

xmlParser = [[NSXMLParseralloc]initWithData:data];//通过文件中的二进制数据初始化xml解析器


其解析过程是一样的,只是修改一下各个节点的节点名就可以了。

很简单,代码就不贴了。







你可能感兴趣的:(xml,NSXMLParser)