使用TFHpple解析html

转自---https://yq.aliyun.com/articles/30672

前期准备工作
引入静态库文件

使用TFHpple解析html_第1张图片
引入静态库文件.png

添加库文件的 header search paths(注意,必须选中 All)

使用TFHpple解析html_第2张图片
添加库文件的 header search paths.png

将从github上下载的源码包拖入工程当中,或cocoapods集成

使用TFHpple解析html_第3张图片
源码包拖入工程当中.png

使用详情
我们来解析网址 http://www.cnblogs.com/YouXianMing/ 中的title标签

使用TFHpple解析html_第4张图片
title标签.png

思路是这样子的:

  1. 将网页转换成NSData

  2. 按照标签值在NSData中数据进行查询

  3. 检索出想要的数据

使用TFHpple解析html_第5张图片

打印信息如下:

2014-05-16 11:34:19.227 Html[3736:60b] 游贤明 - 博客园
2014-05-16 11:34:19.230 Html[3736:60b] 游贤明 - 博客园

我们来解析复杂点的,如将网页中所有的摘要信息解析出来.

使用TFHpple解析html_第6张图片
使用TFHpple解析html_第7张图片
使用TFHpple解析html_第8张图片

再来测试下CSDN的:

使用TFHpple解析html_第9张图片

只要你能分清楚:
节点
节点属性
节点属性值
节点的内容
剩下的事情都好办!

你可能感兴趣的:(使用TFHpple解析html)