c++ 解析xml 解析html

最近根据导师的要求做了一个解析xml文件、抓取html网页、解析网页的小程序。但是却耗费了一周的时间。收获颇多,实践是检验真理的唯一标准是十分正确的。

1、首先选择的语言是C++(自己比较熟悉的一种编程语言),结果发现开源的c++库少的可怜。

2、解析xml文件的c++库还是有一些的。我刚开始用的是tinyxml,很小,很容易上手,但是最大的遗憾就是不支持wchar_t类型。就是因为这个原因最后不得不放弃。最后用的是rapidxml,它是基于c++的template模版的,接口类型和tinyxml差不多。但最大的亮点(我认为)是它支持wchar_t。

3、c++在windows下的html开源解析库基本是没有的。这令我很失望,还好我只是要其中的一些细心,不用将整个html文件解析成DOM树。用wstring(string)的find类函数基本解决。(问题的解决有点牵强偷笑

4、最大的感触就是学习java很有必要,就冲着那么多的开源的库大笑

你可能感兴趣的:(编程)