让我的C++程序直接阅读网页

为了使我的程序能够不依赖浏览器,直接从感兴趣Web网页中抽取信息,
又感到现有的一些库或解析器庞大而不方便,于是基于pull的方式写了
一组实用的HTML解析函数。这样就可以摆脱浏览器,让自编的软件方便
地阅读Web网页。

经过几年来的使用,发现能够用于不少用途,如 Yahoo登录,寻找股票
保价,浏览各种论坛等等。

为了能有机会与有同样需要和兴趣的编程爱好者共同讨论提高,我将
陆续贴出这组解析HTML文档的实用C函数,如下列表:

void
canonHTML( string & htmltext )
规范化HTML文档

void
getHTMLLink( string & obj_url,
 const string & htmltext,
 UInt32 index,
 const string & name )
获取超链接的地址

void
getHTMLObject( string & obj,
 const string & htmltext,
 const string & tag,
 UInt32 tagindex,
 UInt32 unpair )
获取某个tag的内容,含tag本身

void
getHTMLObjectText( string & obj,
 const string & htmltext,
 const string & tag,
 UInt32 tagindex,
 UInt32 unpair )
获取某个tag的内容,不含tag



更多请看: 让我的C++程序直接阅读网页(1) 规范化HTML文档

你可能感兴趣的:(让我的C++程序直接阅读网页)