这两天接触了一个c++编写的xml解析库——pugixml,能解析xml内容,支持xpath解析,且能跨linux平台,不错!以前一直习惯用CMarkup,主要用它读写xml配置文件,但CMarkup不支持xpath,也只能在windows用,虽然习惯了CMarkup,不过若需要xpath解析,又需要跨linux平台,相比之下,pugixml确实是很好的选择,操作速度也快。学习文档:http://pugixml.googlecode.com/svn/tags/latest/docs/quickstart.html , 总结一下使用步骤和简单的使用方法:
(1)使用pugixml库需要三个文件:pugiconfig.h/pugixml.h/pugixml.cpp,可直接从gugixml官网下载,将其加入工程,使用处包含头文件pugiconfig.h/pugixml.h即可。
(2)加载xml文件,使用xml_document类的load_file接口:
std::strFile = "../test.xml";
pugi::xml_document doc;
if (!doc.load_file(strFile.c_str()))
{ //return -1;}
(3)加载xml格式的字符串,使用xml_document类的load接口:
std::strText = "****";
pugi::xml_document doc;
if (!doc.load(strText.c_str()))
{ //return -1;}
(4)xml节点读取,如xml文件params.xml:
<?xml version="1.0" encoding="utf-8" ?>
<root>
<!-- 输入参数配置 -->
<form ip="10.2.134.243" port="80" action="sisserver.php">
<input name="data_type" value="POI" />
<input name="query_type" value="TQUERY" />
<input name="category" value="" />
<!-- 查询词的返回结果xpath配置 -->
<xpath poiroot="//list/poi" idfield="pguid" namefield="name"/>
<!-- 评分权重配置 r1~r4-期望结果的权重,n1~n10-实际查询结果的排名权重-->
<weight>
<!-- 查询词正常得分阀值 -->
<threshold>3</threshold>
<!-- 计算分数分布情况的步长值 -->
<step>0.5</step>
</weight>
</root>
读取代码:
std::string strFile = "/bak/workspace/test/src/params.xml";
pugi::xml_document doc;
if (!doc.load_file(strFile.c_str()))
{return 0;}
pugi::xml_node form = doc.child("root").child("form");
std::string ip = form.attribute("ip").value();
std::string port = form.attribute("port").value();
char cBuf[2083];
sprintf(cBuf, "http://%s:%s/%s?", ip.c_str(), port.c_s());
std::string strTemp(cBuf);
std::string m_strURLBase = strTemp;
for (pugi::xml_node input = form.first_child(); input;
input = input.next_sibling())
{
std::string strValue = input.attribute("value").value();
if (!strValue.empty())
{
std::string strName = input.attribute("name").value();
sprintf(cBuf, "%s=%s&", strName.c_str(), strValue.c_str());
std::string strTemp(cBuf);
m_strURLBase += strTemp;
}
}
//读取xpath
pugi::xml_node xpath = doc.child("root").child("xpath");
std::string m_strPOIRoot = xpath.attribute("poiroot").value();
std::string m_strPOIID = xpath.attribute("idfield").value();
//读取评分权重
pugi::xml_node weight = doc.child("root").child("weight");
float m_fThred = atof(weight.child_value("threshold"));
float m_fStep = atof(weight.child_value("step"));
(5)xpath解析,如xml格式的字符串strWebContent:
<?xml version="1.0" encoding="utf-8" ?>
<root>
<list count="3" time"10">
<poi>
<pguid>123</pguid>
<name>xx1</name>
</poi>
<poi>
<pguid>456</pguid>
<name>xx2</name>
</poi>
<poi>
<pguid>789</pguid>
<name>xx3</name>
</poi>
</list>
</root>
其中,xpath根路径:m_strPOIRoot="//list/poi",
需要取值的项:strPOIID=“pguid”,strPOINam=“name”。
读取代码:
//从strWebContent内容中解析出pguid和name
pugi::xml_document doc;
pugi::xml_parse_result result = doc.load(strWebContent.c_str());
if (!result)
{return -1;}
pugi::xpath_node_set tools = doc.select_nodes(m_strPOIRoot.c_str());
for (pugi::xpath_node_set::const_iterator it = tools.begin();
it != tools.end(); ++it)
{
pugi::xpath_node node = *it;
string strPOI = node.node().child_value(m_strPOIID.c_str());
string strName = node.node().child_value(m_strPOIName.c_str());
}