HTML 資訊汲取（中篇） - Default namespace 問題

在上一篇文章『HTML 資訊汲取（上篇） - 使用 JDOM 、 TagSoup 及 XPath』裡，我提到了如何利用 JDOM 搭配 TagSoup，並使用 XPath 簡單地汲取資訊。其實，在上一篇的範例裡，我刻意避開了兩個困擾許多人的問題：namespace(命名空間)問題以及TagSoup 的輸出問題。

Namespace 問題

再看一下上一篇出現的新聞標題：

<spanclass="titletext">曾雅妮的魔幻數字與粉紅色</span>

假設，除了 span 之外，還有其他標籤，譬如 h4，也具有 titletext 類別，但是只有 span 是我們要的新聞標題。在這樣的情況下，為了僅選擇 sapn 標籤，我們應該將原來的 XPath：

//*[contains(@class,'titletext')]

改成這樣：

//span[contains(@class,'titletext')]

將此 XPath 套用到上一篇的程式中，執行看看。

def xpath =XPath.newInstance("//span[contains(@class,'titletext')]")def result = xpath.selectNodes( doc ) result.each { println it.text }

看看輸出結果。看到了嗎？沒有任何輸出！

TagSoup 的 namespace 輸出問題

為什麼會這樣呢？

這是因為 TagSoup 解析 HTML 時，不論原始網頁是否是 XHTML、是否含有 namespace 的定義，都一律會將網頁輸出成 XHTML 格式，並（只）含有下列 namespace 的定義︰

<htmlxmlns="http://www.w3.org/1999/xhtml"xmlns:html="http://www.w3.org/1999/xhtml">

其中 xmlns="http://www.w3.org/1999/xhtml" 是『default namespace(預設命名空間)』。所謂 default namespace，是指若 XML 標籤未明確指明其 namespace，則自動歸屬於該 namespace。

而 xmlns:html="http://www.w3.org/1999/xhtml" 則是一般的 namespace，該 namespace 使用 html 當作 prefix (前置字符) 作為別名，所有含有該 prefix 的標籤，歸屬於該 namespace。Prefix 可由 XML 文件（網頁）設計者自行指定。

這裡的重要觀念是，namespace 並非由 prefix 決定，而是由引號中的 URI 指定。上面兩個 namespace，不論是 default namespace 或是以 html 作為 prefix 指定的一般 namespace，由於他們的 URI 皆為 http://www.w3.org/1999/xhtml，所以其實是同一個 namespace。也就是說，在這個例子裡，span 跟 html:span 兩種寫法是等價的，指的都是 http://www.w3.org/1999/xhtml 這個 namespace。

上面『（只）含有』的意思是，如果網頁同時含有其他 namespace 的定義，都會被 TagSoup 移除，並且在實際用到該 prefix 的標籤處，換成類似下面這樣的宣告：

<html:spanxmlns:html="urn:x-prefix:html">prefix:html</html:span>

如上所示，連使用 html 為 prefix 的標籤，都慘遭毒手。別忘了，這可是 TagSoup 在 html 標籤中強制輸出的 prefix。經過 TagSoup 這樣的修改，所有加上 prefix 的標籤，反而都對應不到正確的 namespace 了。等於是把 namespace 給廢了。（這似乎是刻意的，請參考 TagSoup 的 change log: Changes from 0.9.7 to 0.10.1 (there is no 0.10.0)）

動手實驗證明

可以作個簡單的實驗證明：

namespace.groovy
import java.io.import org.jdom.import org.jdom.input.import org.jdom.xpath.import org.jdom.output.import org.xml.sax.def xhtml ="""<html xmlns="http://www.w3.org/1999/xhtml" xmlns:myns="http://www.w3.org/1999/xhtml" xmlns:html="http://www.w3.org/1999/xhtml"/><head><title>NamespacePrefixTest</title></head><body><span>prefix:default</span><html:span>prefix:html</html:span><myns:span>prefix:myns</myns:span></body></html>""" def xpaths = [ "" : "//span","html":"//html:span","myns":"//myns:span"]def builder =newSAXBuilder("org.ccil.cowan.tagsoup.Parser")//def builder = new SAXBuilder()def outputter =newXMLOutputter()defis=newInputSource(newByteArrayInputStream( xhtml.bytes ))def doc = builder.build(is) println "input:\n"+ xhtml println "output:\n"+ outputter.outputString( doc ) println "result:\n" xpaths.each { prefix, path -> println "namespace prefix: \"${prefix}\"; xpath: \"${path}\""def xpath =XPath.newInstance( path ) xpath.addNamespace( prefix,"http://www.w3.org/1999/xhtml")def result = xpath.selectNodes( doc ) result.each { println " "+ outputter.outputString( it )}}

import java.io.*import org.jdom.*import org.jdom.input.*import org.jdom.xpath.*import org.jdom.output.*import org.xml.sax.*def xhtml ="""<html xmlns="http://www.w3.org/1999/xhtml" xmlns:myns="http://www.w3.org/1999/xhtml" xmlns:html="http://www.w3.org/1999/xhtml"/><head><title>NamespacePrefixTest</title></head><body><span>prefix:default</span><html:span>prefix:html</html:span><myns:span>prefix:myns</myns:span></body></html>""" def xpaths = [ "" : "//span","html":"//html:span","myns":"//myns:span"]def builder =newSAXBuilder("org.ccil.cowan.tagsoup.Parser")//def builder = new SAXBuilder()def outputter =newXMLOutputter()defis=newInputSource(newByteArrayInputStream( xhtml.bytes ))def doc = builder.build(is) println "input:\n"+ xhtml println "output:\n"+ outputter.outputString( doc ) println "result:\n" xpaths.each { prefix, path -> println "namespace prefix: \"${prefix}\"; xpath: \"${path}\""def xpath =XPath.newInstance( path ) xpath.addNamespace( prefix,"http://www.w3.org/1999/xhtml")def result = xpath.selectNodes( doc ) result.each { println " "+ outputter.outputString( it )}}

執行結果如下：

input:<html xmlns="http://www.w3.org/1999/xhtml" xmlns:html="http://www.w3.org/1999/xhtml" xmlns:myns="http://www.w3.org/1999/xhtml"><head><title>NamespacePrefixTest</title></head><body><span>prefix:default</span><html:span>prefix:html</html:span><myns:span>prefix:myns</myns:span></body></html> output:<?xml version="1.0" encoding="UTF-8"?><html xmlns="http://www.w3.org/1999/xhtml" xmlns:html="http://www.w3.org/1999/xhtml"><head><title>NamespacePrefixTest</title></head><body><span>prefix:default</span><html:span xmlns:html="urn:x-prefix:html">prefix:html</html:span><myns:span xmlns:myns="urn:x-prefix:myns">prefix:myns</myns:span></body></html> result:namespace prefix:""; xpath:"//span"namespace prefix:"html"; xpath:"//html:span"<span xmlns="http://www.w3.org/1999/xhtml">prefix:default</span>namespace prefix:"myns"; xpath:"//myns:span"<span xmlns="http://www.w3.org/1999/xhtml">prefix:default</span>

首先，可以看到在 html 標籤元素裡，在輸入部份我分別用了三個 prefix：無(default), html 和 myns ，其 URI 都對應到 http://www.w3.org/1999/xhtml。不過，TagSoup 輸出時，卻移除了 myns 的定義，只留下：

<?xml version="1.0" encoding="UTF-8"?><htmlxmlns="http://www.w3.org/1999/xhtml"xmlns:html="http://www.w3.org/1999/xhtml">

同時，使用了 prefix 指定 namespace 的 span 標籤元素，原本是這樣子：

<span>prefix:default</span><html:span>prefix:html</html:span><myns:span>prefix:myns</myns:span>

TagSoup 輸出後，卻變成這樣：

<span>prefix:default</span><html:spanxmlns:html="urn:x-prefix:html">prefix:html</html:span><myns:spanxmlns:myns="urn:x-prefix:myns">prefix:myns</myns:span>

注意到使用 html 和 myns 兩個 prefix 所定義的標籤都被改掉了。

此時，XPath 選擇的結果，未指定 namespace，也就是不加上 prefix 的 //span XPath 路徑，完全找不到對應標籤元素；而使用了 prefix 的 //html:span 和 //myns:span XPath 路徑，卻只找到使用 default namespace 定義的 span 標籤元素：

<spanxmlns="http://www.w3.org/1999/xhtml">prefix:default</span>

注意到程式碼中的這一行：

xpath.addNamespace( prefix,"http://www.w3.org/1999/xhtml")

這是告訴 XPath 如何將 prefix 對應到 URI。

當 XPath 進行比對時，除了會由 XML 文件的 namespace 定義中，建立 namespace 的 prefix / URI 對應表，還會查找我們提供的 prefix / URI 對應關係。這是因為文件撰寫者與 XPath 使用者通常不會是同一人，由於 prefix 是可以自訂的，所以 namespace 被設計成使用 URI 作為識別，prefix 則只是當作該 URI 的別名使用。由於嚴格的 XML 須使用 DTD 定義，因此所有的合法標籤，都應該已被定義在適當的 namespace 之中，也就是說，對應到特定的 URI。所以，XPath 只需提供方法，讓 XPath 使用者使用任意自訂的 prefix，再提供方法，讓該 prefix 能指向正確的 URI，即可對應到正確的 namespace 了。

但由於 TagSoup 輸出的 XHTML 中，將我們定義的 myns 移除了，JDOM 無法從 XHTML 中建立 myns 的對應關係，此時如果將呼叫 addNamespace() 函數的這一行程式碼移除，JDOM 將找不到 myns 對應的 URI 定義，於是在解析 XPath 時，將會丟出這樣的錯誤訊息：

Caught: org.jdom.JDOMException:XPath error while evaluating "//myns:span":XPath expression uese unbound namespace prefix myns:XPath expression uses unbound namespace prefix myns

內建 XML 解析器沒有 TagSoup 的輸出問題

另一方面，由於我提供的輸入，雖然不是標準的 XHTML，卻是符合 well-formed XML 格式的，所以 JDOM 內建（正確的講，應該是 JAXP 內建）的 XML 解析器其實是可以正確解讀的。把程式碼裡面，配置 SAXBuilder 的那一行：

def builder =newSAXBuilder("org.ccil.cowan.tagsoup.Parser")

改成不指定解析器類別，像這樣：

def builder =newSAXBuilder()

就可以使用 JDOM 內建的 XML 解析器。執行結果如下：

input:<html xmlns="http://www.w3.org/1999/xhtml" xmlns:html="http://www.w3.org/1999/xhtml" xmlns:myns="http://www.w3.org/1999/xhtml"><head><title>NamespacePrefixTest</title></head><body><span>prefix:default</span><html:span>prefix:html</html:span><myns:span>prefix:myns</myns:span></body></html> output:<?xml version="1.0" encoding="UTF-8"?><html xmlns="http://www.w3.org/1999/xhtml" xmlns:html="http://www.w3.org/1999/xhtml" xmlns:myns="http://www.w3.org/1999/xhtml"><head><title>NamespacePrefixTest</title></head><body><span>prefix:default</span><html:span>prefix:html</html:span><myns:span>prefix:myns</myns:span></body></html> result:namespace prefix:""; xpath:"//span"namespace prefix:"html"; xpath:"//html:span"<span xmlns="http://www.w3.org/1999/xhtml">prefix:default</span><html:span xmlns:html="http://www.w3.org/1999/xhtml">prefix:html</html:span><myns:span xmlns:myns="http://www.w3.org/1999/xhtml">prefix:myns</myns:span>namespace prefix:"myns"; xpath:"//myns:span"<span xmlns="http://www.w3.org/1999/xhtml">prefix:default</span><html:span xmlns:html="http://www.w3.org/1999/xhtml">prefix:html</html:span><myns:span xmlns:myns="http://www.w3.org/1999/xhtml">prefix:myns</myns:span>

注意到，輸出的部份，保留了我原本的 namespace 定義：

<?xml version="1.0" encoding="UTF-8"?><htmlxmlns="http://www.w3.org/1999/xhtml"xmlns:html="http://www.w3.org/1999/xhtml"xmlns:myns="http://www.w3.org/1999/xhtml">

標籤的 prefix 也正確保留了：

<span>prefix:default</span><html:span>prefix:html</html:span><myns:span>prefix:myns</myns:span>

而 XPath 選取的結果，除了未指定 namespace 的 //span XPath 路徑仍然對應不到任何元素外，兩個使用了 prefix 指定命名空間的 XPath 路徑，現在都能選到三個 span 標籤元素：

<spanxmlns="http://www.w3.org/1999/xhtml">prefix:default</span><html:spanxmlns:html="http://www.w3.org/1999/xhtml">prefix:html</html:span><myns:spanxmlns:myns="http://www.w3.org/1999/xhtml">prefix:myns</myns:span>

注意，上面這三個 span 標籤分別使用了不同的 prefix 定義。證明命名空間相同與否，並非由 prefix 決定，而是由 URI 決定。只要 URI 相同，不論 prefix 如何定義，都將被視為相同的命名空間。

另外，此時即使移除程式碼中的這一行：

xpath.addNamespace( prefix,"http://www.w3.org/1999/xhtml")

XPath 選擇的結果也完全相同。可見得 JDOM 可以透過 html 標籤中的 xmlns 的namespace 定義，正確的對應 prefix。

若進一步實驗：將 html 標籤中的 default namespace 定義移除，而保留另外兩個具 prefix 的 namespace 的定義：

import java.io.*import org.jdom.*import org.jdom.input.*import org.jdom.xpath.*import org.jdom.output.*import org.xml.sax.*def xhtml ="""<html xmlns:html="http://www.w3.org/1999/xhtml" xmlns:myns="http://www.w3.org/1999/xhtml"><head><title>NamespacePrefixTest</title></head><body><span>prefix:default</span><html:span>prefix:html</html:span><myns:span>prefix:myns</myns:span></body></html>""" def xpaths = [ "" : "//span","html":"//html:span","myns":"//myns:span"]//def builder = new SAXBuilder( "org.ccil.cowan.tagsoup.Parser" )def builder =newSAXBuilder()def outputter =newXMLOutputter()defis=newInputSource(newByteArrayInputStream( xhtml.bytes ))def doc = builder.build(is) println "input:\n"+ xhtml println "output:\n"+ outputter.outputString( doc ) println "result:\n" xpaths.each { prefix, path -> println "namespace prefix: \"${prefix}\"; xpath: \"${path}\""def xpath =XPath.newInstance( path )//xpath.addNamespace( prefix, "http://www.w3.org/1999/xhtml" )def result = xpath.selectNodes( doc ) result.each { println " "+ outputter.outputString( it )}}

就會發現，原本未使用 prefix 指定 namespace 的 XPath 路徑：//span 也可以對應到元素了：

namespace prefix:""; xpath:"//span"<span>prefix:default</span>

而使用了 prefix 的 XPath 路徑，此時已對應不到未指定 prefix 的元素了：

namespace prefix:"html"; xpath:"//html:span"<html:span xmlns:html="http://www.w3.org/1999/xhtml">prefix:html</html:span><myns:span xmlns:myns="http://www.w3.org/1999/xhtml">prefix:myns</myns:span>namespace prefix:"myns"; xpath:"//myns:span"<html:span xmlns:html="http://www.w3.org/1999/xhtml">prefix:html</html:span><myns:span xmlns:myns="http://www.w3.org/1999/xhtml">prefix:myns</myns:span>

查看 JDOM 的 XPath 類別的 addNamespace() 函數的說明文件，發現了這一段說明：

Note: In XPath, there is no such thing as a 'default namespace'. The empty prefix always resolves to the empty namespace URI.

意思是說：在 XPath 中，並沒有所謂『預設命名空間』。所以，若 prefix 為空字串 ""，則永遠對應到『空』命名空間。

原來，移除了 default namespace 的定義，使得原本未使用 prefix 指定 namespace 的 span 標籤，由原來的 default namespace，轉變成為所謂的 empty namespace，也就是不屬於任何 namespace。因此，指定了 prefix 的 XPath 路徑，如：//html:span，因為其 namespace 為 http://www.w3.org/1999/xhtml，所以就對應不到屬於 empty namespace 的這個標籤元素；而此時，未指定 prefix 的 XPath 路徑：//span，反而就能對應到此 empty namespace 上的 span 標籤元素了。

稍微喘口氣，整理一下。經由上面的實驗結果，我們有了下面兩個結論：

命名空間的識別，是由命名空間定義中的 URI 部份決定，任何 prefix 其實都只是該 namespace 的別名。
若 html 標籤中含有 default namespace 的定義，則文件中所有未指定 prefix 的標籤，都將屬於該 namespace。另一方面，未指定 prefix 的 XPath 路徑，並非對應到 default namespace，而是對應到 empty namespace，因此，使用未指定 prefix 的 XPath 路徑進行選取時，不論是使用 TagSoup 或是 JDOM 內建的 XML 解析器，都對應不到任何標籤。這其實是 XPath 的規範（雖然我覺得這樣很不合理，因為這與 XML 對 namespace 的處理方式並不一致：在 XML 文件中，未指明 prefix 的標籤（或屬性）就歸屬於 default namespace。）

另一方面，我們還遇到了 TagSoup 輸出 namespace 的問題：

TagSoup 處理過的 HTML 文件，一律輸出為 XHTML 格式，並且定義了 xmlns="http://www.w3.org/1999/xhtml" 這個 default namespace，以及xmlns:html="http://www.w3.org/1999/xhtml" 這個以 html 為 prefix 的 namespace。而其餘的 namespace 的定義，都將被移除。
由於 TagSoup 處理過的 HTML 文件，含有 default namespace 的定義，使用 XPath 選取元素時，一定要在路徑的標籤或屬性前，加上 html 這個 prefix，才能對應到元素。
TagSoup 處理過的 HTML 文件，其元素標籤若含有 prefix 定義，即使 prefix 是 html，都會被修改並對應到 urn:x-prefix:html 這樣的 URI（參考 TagSoup 原始碼中 Parser 類別的 foreign() 函數、ElementType 類別的 namespace() 函數以及 change log），因而使該標籤對應不到原本正確的 namespace 的 URI。導致使用了該 prefix 的 XPath 路徑，也對應不到正確的標籤。（原本應該能正確對應的，這一點可以經由使用 JDOM 內建的 XML 解析器的實驗證明。）

在下一篇文章『HTML 資訊汲取（下篇） - TagSoup 輸出 namespace 問題的解決方案』裡，我將介紹 TagSoup 輸出 namespace 問題的解決方法。

歡迎大家的回饋與心得分享。

你可能感兴趣的:(namespace)

2021 CCF 非专业级别软件能力认证第一轮（CSP-J1）入门级C++语言试题（第三大题：完善程序代码） mmz1207 c++csp
最近有一段时间没更新了，在准备CSP考试，请大家见谅。（1）有n个人围成一个圈，依次标号0到n-1。从0号开始，依次0，1，0，1...交替报数，报到一的人离开，直至圈中剩最后一个人。求最后剩下的人的编号。#includeusingnamespacestd;intf[1000010];intmain(){intn;cin>>n;inti=0,cnt=0,p=0;while(cnt#includeu
20个新手学习c++必会的程序输出*三角形、杨辉三角等（附代码） X_StarX c++学习算法大学生开发语言数据结构
示例1:HelloWorld#includeusingnamespacestd;intmain(){coutusingnamespacestd;intmain(){inta=5;intb=10;intsum=a+b;coutusingnamespacestd;intfactorial(intn){if(nusingnamespacestd;voidprintFibonacci(intn){intt
[Unity]在场景中随机生成不同位置且不重叠的物体 Bartender_Jill Graphics图形学笔记 unity 游戏引擎动画
1.前言最近任务需要用到Unity在场景中随机生成物体，且这些物体不能重叠，简单记录一下。参考资料:Howtoensurethatspawnedtargetsdonotoverlap?2.结果与代码结果如下所示：代码如下所示：usingSystem.Collections.Generic;usingUnityEngine;namespaceAssets.Scripts{publicclassNew
HarmonyOS Next鸿蒙扫一扫功能实现 JohnLiu_ HarmonyOS Next harmonyos 华为扫一扫鸿蒙
直接使用的是华为官方提供的api，封装成一个工具类方便调用。import{common}from'@kit.AbilityKit';import{scanBarcode,scanCore}from'@kit.ScanKit';exportnamespaceScanUtil{exportasyncfunctionstartScan(context:common.Context):Promise{if
Istio pilot-discovery服务发现源码解析（1.13版本） xidianjiapei001 #Istio istio 云原生服务发现
Istiopilot-discovery服务发现介绍工作机制初始化初始化Config控制器初始化Service控制器controller初始化NamespaceServiceNodePodPilotDiscovery各组件启动流程DiscoveryServer接收Envoy的gRPC连接请求流程Config变化后向Envoy推送更新的流程总结参考介绍IstioPilot的代码分为Pilot-Dis
静态常量（static const）|| 日志记录器课堂随想 moveit2 机器人
//AllsourcefilesthatuseROSloggingshoulddefineafile-specific//staticconstrclcpp::LoggernamedLOGGER,locatedatthetopofthefile//andinsidethenamespacewiththenarrowestscope(ifthereisone)staticconstrclcpp::L
C++深拷贝构造函数解决浅拷贝的堆区内存重复释放问题程序猿练习生 c++c++
1.简单介绍先简单介绍一下浅拷贝和深拷贝：浅拷贝->简单的赋值拷贝操作，默认的拷贝构造函数就是浅拷贝。深拷贝->在堆区重新申请空间，进行拷贝操作。2.问题展示下面用代码示例明了地展示默认拷贝构造函数浅拷贝带来地堆区内存重复释放问题：#includeusingnamespacestd;classPerson{public:intm_Age;int*m_Height;public:Person(){c
蓝桥杯18小白第5题 @liu666 蓝桥杯算法职场和发展
思维，#includeusingnamespacestd;#defineintlonglongconstintn=1e6+11;inta,b[n],c[n],d,k[n];structs{intx,y,z;}q[n];boolcmp(sa1,sa2){returna1.z>a;for(inti=1;i>q[i].x;}for(inti=1;i>q[i].y;q[i].z=q[i].x+q[i].y
【自用25.1】C++-智能交友系统项目 .远_ 学习笔记 C++Pro c++算法开发语言
注：项目类文章会陆续更新，请大家关注系列文章创建Girl类头文件#pragmaonce#includeusingnamespacestd;classBoy;classGirl{public:Girl();Girl(intage,stringname,intstyle);~Girl();intgetAge()const;stringgetName()const;intgetStyle()const;
P1228 地毯填补问题「已注销」 c++数据结构算法
![](地毯填补问题-洛谷)#includeusingnamespacestd;#defineqwdfs(zx+l-1,zy+l-1,zx,zy,l);#definewedfs(zx+l-1,zy+l,zx,zy+l,l);#defineerdfs(zx+l,zy+l-1,zx+l,zy,l);#definertdfs(zx+l,zy+l,zx+l,zy+l,l);voiddfs(intx,int
P1576 最小花费「已注销」算法 c++数据结构
![](最小花费-洛谷)#includeusingnamespacestd;inthead[200010],tim;doubledis[200010];boolflag[200010];structcsz{intto;doublew;intnext;}edge[200010];voidadd(intu,intv,doublew){edge[++tim].to=v;edge[tim].w=1.0-w
MyBatis 查询数据库_mybatis查询某个库的所有表名(2) 2401_84181942 程序员 mybatis oracle tomcat
标签说明：***``标签**：需要指定namespace属性，表示命名空间，值为mapper接口的全限定名，包括全包名.类名。***``查询标签**：是用来执行数据库的查询操作的：`id`：是和Interface（接口）中定义的方法名称一样的，表示对接口的具体实现方法。`resultType`：是返回的数据类型，也就是开头我们定义的实体类。####2.4.4添加Service服务层实现代码如下：@
P2865 [USACO06NOV] Roadblocks G（洛谷）(次短路) 叶子清不青算法
开一个二维数组dis[N][2]分别记录最短路和次短路即可。dijkstra和spfa均可，推荐spfa。//dijkstra#includeusingnamespacestd;constintN=1e5+5;typedeflonglongll;typedefpairPII;intn,m,k;intT;priority_queue,greater>q;structnode{inte,w;};vec
c++实现int转string以及验证效果还不秃顶的计科生 C/C++c++java 开发语言
第一部分：转换方法（1）导包#include（2）转换stringstring1=to_string(n);第二部分：案例展示将int类型的100转换为字符串类型的100，并输出转换后的这个字符串的第一个字符作为验证：#includeusingnamespacestd;#include#includeintmain(){intn=100;stringstring1=to_string(n);cou
函数可以返回数组吗？有哪3种返回方法呢？如代码种的func2、func3、func4都可以返回数组。func1为什么会报错呢？关于返回数组需要注意哪些呢？神笔馬良 java 算法数据结构
问题描述：根据下列代码回答下列问题。//Createdby黑马程序员.#include"iostream"usingnamespacestd;/**函数返回数组，就是返回指针，要注意：*-不可返回局部数组（在函数内创建的数组），如果要返回需要*-static修饰*-动态内存创建（new[]、delete[]）*-返回全局（在函数外创建的对象）**不推荐函数返回数组，因为要么手动delete、要么s
洛谷水题记录木木ainiks 算法 c++数据结构
P1093[NOIP2007普及组]奖学金sort排序即可注意cmp的写法#include#includeusingnamespacestd;structnode{intid;intchinese;intmath;intenglish;intcount;}a[305];intcmp(node&a,node&b){if(a.count!=b.count){returna.count>b.count;
10/24 每周学习总结5 木木ainiks 1024程序员节
1RecordingtheMoolympicsS#include#includeusingnamespacestd;typedeflonglongint_1;intn;structnode{int_1begin_b;int_1end_e;}a[300];boolcmp(nodea,nodeb){if(a.end_e==b.end_e)returna.begin_b>b.begin_b;return
Luogu P3489 [POI2009]WIE-Hexer 最短路躲不过这哀伤
https://www.luogu.org/problemnew/show/P3489普通的最短路，不过我觉得这个复杂度按道理来说边数不应该是m*2^13吗，不知道是数据比较水还是实际上能证明复杂度低一些。代码如下#includeusingnamespacestd;constintmaxn=210;#definepapairintn,m,p,k;intdis[maxn][8200]={},kn[m
P4779 【模板】单源最短路径(堆优化dijkstra) summ1ts 一些模版算法图论最短路 dijkstra 堆
堆优化dijkstra，时间复杂度，我个人写习惯的模版。#includeusingnamespacestd;#definePIIpair#definefifirst#definesesecondconstintN=2e5+10;intread(){intx=0,f=1;charch=getchar();while(!isdigit(ch)){if(ch=='-')f=-1;ch=getchar()
洛谷P2066 机器分配 summ1ts 算法动态规划
此题可用动态规划解决，首先进行阶段划分，可将解决问题的过程看作逐一为每家公司分配机器，因此按照已分配公司数量划分阶段，设变量i代表前i家公司。设计状态，设f[i][j]代表前i家公司分配j台设备能产生的最大盈利。确定决策为第i家公司分配多少设备，决策变量k范围0usingnamespacestd;inta[20][20],f[20][20],g[20][20];intn,m;voidprint(i
洛谷 P1378 油滴扩展 summ1ts 算法
本题可以利用dfs计算，重点是计算某一个油滴可以扩展的半径，并搜索得出所有油滴可以扩展的最大面积。由题意可知：（1）：油滴的半径不能越过长方形方框的边界（2）：判断当前油滴与其他油滴的关系：是否位于其他油滴内，最多只能与其他油滴相交#includeusingnamespacestd;#definepi3.1415926intn;intxa,ya,xb,yb;structnode{intx,y;do
AtCoder Beginner Contest 168题解 linbinwu123 AtCoder
这里写目录标题A-∴(Therefore)代码B-...(TripleDots)代码C-:(Colon)代码D-..(DoubleDots)题意题解代码E-∙(Bullet)题意题解代码前三题比较水，直接上代码A-∴(Therefore)代码#includeusingnamespacestd;intmain(){intn;scanf("%d",&n);n=n%10;if(n==3)printf("
AtCoder Beginner Contest 369 题解 nike0good 比赛题解线段树树形DP 算法 c++数据结构线段树树dp
A-369#includeusingnamespacestd;#defineFor(i,n)for(inti=1;i=k;i--)#defineRep(i,n)for(inti=0;i=0;i--)#defineForp(x)for(intp=pre[x];p;p=next[p])#defineForpiter(x)for(int&p=iter[x];p;p=next[p])#defineLson
C++快速入门扫盲总结六竹书生__wa C/C++Qt
C++快速入门扫盲总结C++语言新特性C++的新特性C++的输入输出方式C++之命名空间namespaceC++面向对象类和对象构造函数与析构函数this指针继承重载函数重载运算符重载多态数据封装数据抽象接口（抽象类）C++语言新特性C++的新特性C++比C语言新增的数据类型是布尔类型（bool）。但是在新的C语言标准里已经有布尔类型了，但是在旧的C语言标准里是没有布尔类型的，编译器也无法解释布尔
BindingException: Invalid bound statement (not found) 小卡车555 MyBatis mybatis java mysql
Mybatis出现绑定异常问题的解决org.apache.ibatis.binding.BindingException:Invalidboundstatement(notfound)一般的原因是Mapperinterface和xml文件的定义对应不上，需要检查包名，namespace，函数名称等能否对应上，需要比较细致的对比，我经常就是写错了一两个字母搞的很长时间找不到错误按以下步骤一一执行：1
Dev-C++头文件小Bug 蒟蒻pzjdsg666 bug c语言 c++
Dev-C++应该是大家最常用的C++软件了吧，但它有几个小Bug。1、“万能头”众所周知，“万能头”在官方比赛中不能使用（你要用没人拦着你~呵呵），但在Dev-C++可以使用。所以，我们可以省掉好多头文件！如下：#includeusingnamespacestd;2、C语言头文件在Dev-C++中，你竟然可以使用C语言头文件（惊不惊喜~意不意外~）如下：#include3、iostream竟然包
虚基类的声明无休居士 c++简单代码
//虚基类的声明#includeusingnamespacestd;classBase{public:Base(){a=5;cout<<"Basea="<
递推(c++) 少年负剑去基础算法 c++算法数据结构
与递归相反递归是将一个问题分成若干个子问题而递推是先求出若干个子问题再去推出那个问题1、斐波那契额数列以下数列01123581321...被称为斐波纳契数列。这个数列从第33项开始，每一项都等于前两项之和。输入一个整数NN，请你输出这个序列的前NN项。输入格式一个整数NN。输出格式在一行中输出斐波那契数列的前NN项，数字之间用空格隔开。数据范围0usingnamespacestd;intq[47]
百练OJ——2019研究生推免上机考试笔记智慧的旋风 acm/机试程序设计
这两天在刷题，就写一篇博客水水。没全做完，看到最后三题做的人不多就先不做了（捂脸）。传送门：2019研究生推免上机考试A:有趣的跳跃简单的模拟#include#include#includeusingnamespacestd;inta[3005],b[3005];intn;booljudge(){for(inti=1;i>n;for(inti=1;i>a[i];}for(inti=1;i#incl
【蓝桥杯】2.走出迷宫的最少步数——DFS 电次电次深度优先蓝桥杯算法
1432-【基础】走出迷宫的最少步数题目描述一个迷宫由R行C列格子组成，有的格子里有障碍物，不能走；有的格子是空地，可以走。给定一个迷宫，求从左上角走到右下角最少需要走多少步(数据保证一定能走到)。只能在水平方向或垂直方向走，不能斜着走。输入第一行是两个整数，R和C，代表迷宫的行数和列数。（1usingnamespacestd;intn,m;chara[50][50];//地图intd[50][5
继之前的线程循环加到窗口中运行 3213213333332132 java thread JFrame JPanel
之前写了有关java线程的循环执行和结束，因为想制作成exe文件，想把执行的效果加到窗口上，所以就结合了JFrame和JPanel写了这个程序，这里直接贴出代码，在窗口上运行的效果下面有附图。 package thread; import java.awt.Graphics; import java.text.SimpleDateFormat; import java.util
linux 常用命令 BlueSkator linux 命令
1.grep 相信这个命令可以说是大家最常用的命令之一了。尤其是查询生产环境的日志，这个命令绝对是必不可少的。但之前总是习惯于使用（grep -n 关键字文件名）查出关键字以及该关键字所在的行数，然后再用（sed -n '100,200p' 文件名），去查出该关键字之后的日志内容。但其实还有更简便的办法，就是用（grep -B n、-A n、-C n 关键
php heredoc原文档和nowdoc语法 dcj3sjt126com PHP heredoc nowdoc
<!doctype html> <html lang="en"> <head> <meta charset="utf-8"> <title>Current To-Do List</title> </head> <body> <?
overflow的属性周华华 JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
《我所了解的Java》——总体目录 g21121 java
准备用一年左右时间写一个系列的文章《我所了解的Java》，目录及内容会不断完善及调整。在编写相关内容时难免出现笔误、代码无法执行、名词理解错误等，请大家及时指出，我会第一时间更正。 &n
[简单]docx4j常用方法小结 53873039oycg docx
本代码基于docx4j-3.2.0，在office word 2007上测试通过。代码如下: import java.io.File; import java.io.FileInputStream; import ja
Spring配置学习云端月影 spring配置
首先来看一个标准的Spring配置文件 applicationContext.xml <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi=&q
Java新手入门的30个基本概念三 aijuans java 新手 java 入门
17.Java中的每一个类都是从Object类扩展而来的。　　18.object类中的equal和toString方法。　　equal用于测试一个对象是否同另一个对象相等。　　toString返回一个代表该对象的字符串,几乎每一个类都会重载该方法,以便返回当前状态的正确表示.(toString 方法是一个很重要的方法)　　 19.通用编程:任何类类型的所有值都可以同object类性的变量来代替。　
《2008 IBM Rational 软件开发高峰论坛会议》小记 antonyup_2006 软件测试敏捷开发项目管理 IBM 活动
我一直想写些总结,用于交流和备忘,然都没提笔,今以一篇参加活动的感受小记开个头,呵呵! 其实参加《2008 IBM Rational 软件开发高峰论坛会议》是9月4号,那天刚好调休.但接着项目颇为忙,所以今天在中秋佳节的假期里整理了下. 参加这次活动是一个朋友给的一个邀请书,才知道有这样的一个活动,虽然现在项目暂时没用到IBM的解决方案,但觉的参与这样一个活动可以拓宽下视野和相关知识.
PL/SQL的过程编程,异常,声明变量,PL/SQL块百合不是茶 PL/SQL的过程编程异常 PL/SQL块声明变量
PL/SQL; 过程; 符号; 变量; PL/SQL块; 输出; 异常; PL/SQL 是过程语言(Procedural Language)与结构化查询语言(SQL)结合而成的编程语言PL/SQL 是对 SQL 的扩展,sql的执行时每次都要写操作
Mockito(三)--完整功能介绍 bijian1013 持续集成 mockito 单元测试
mockito官网：http://code.google.com/p/mockito/，打开documentation可以看到官方最新的文档资料。一.使用mockito验证行为 //首先要import Mockito import static org.mockito.Mockito.*; //mo
精通Oracle10编程SQL(8)使用复合数据类型 bijian1013 oracle 数据库 plsql
/* *使用复合数据类型 */ --PL/SQL记录 --定义PL/SQL记录 --自定义PL/SQL记录 DECLARE TYPE emp_record_type IS RECORD( name emp.ename%TYPE, salary emp.sal%TYPE, dno emp.deptno%TYPE ); emp_
【Linux常用命令一】grep命令 bit1129 Linux常用命令
grep命令格式 grep [option] pattern [file-list] grep命令用于在指定的文件(一个或者多个,file-list)中查找包含模式串(pattern)的行,[option]用于控制grep命令的查找方式。 pattern可以是普通字符串，也可以是正则表达式，当查找的字符串包含正则表达式字符或者特
mybatis3入门学习笔记白糖_ sql ibatis qq jdbc 配置管理
MyBatis 的前身就是iBatis，是一个数据持久层(ORM)框架。 MyBatis 是支持普通 SQL 查询，存储过程和高级映射的优秀持久层框架。MyBatis对JDBC进行了一次很浅的封装。以前也学过iBatis，因为MyBatis是iBatis的升级版本，最初以为改动应该不大，实际结果是MyBatis对配置文件进行了一些大的改动，使整个框架更加方便人性化。
Linux 命令神器：lsof 入门 ronin47 lsof
lsof是系统管理/安全的尤伯工具。我大多数时候用它来从系统获得与网络连接相关的信息，但那只是这个强大而又鲜为人知的应用的第一步。将这个工具称之为lsof真实名副其实，因为它是指“列出打开文件（lists openfiles）”。而有一点要切记，在Unix中一切（包括网络套接口）都是文件。有趣的是，lsof也是有着最多
java实现两个大数相加，可能存在溢出。 bylijinnan java实现
import java.math.BigInteger; import java.util.regex.Matcher; import java.util.regex.Pattern; public class BigIntegerAddition { /** * 题目：java实现两个大数相加，可能存在溢出。 * 如123456789 + 987654321
Kettle学习资料分享，附大神用Kettle的一套流程完成对整个数据库迁移方法 Kai_Ge Kettle
Kettle学习资料分享 Kettle 3.2 使用说明书目录概述..........................................................................................................................................7 1.Kettle 资源库管
[货币与金融]钢之炼金术士 comsci 金融
自古以来,都有一些人在从事炼金术的工作.........但是很少有成功的那么随着人类在理论物理和工程物理上面取得的一些突破性进展...... 炼金术这个古老
Toast原来也可以多样化 dai_lm android toast
Style 1：默认 Toast def = Toast.makeText(this, "default", Toast.LENGTH_SHORT); def.show(); Style 2：顶部显示 Toast top = Toast.makeText(this, "top", Toast.LENGTH_SHORT); t
java数据计算的几种解决方法3 datamachine java hadoop ibatis r-langue r
4、iBatis 简单敏捷因此强大的数据计算层。和Hibernate不同，它鼓励写SQL，所以学习成本最低。同时它用最小的代价实现了计算脚本和JAVA代码的解耦，只用20%的代价就实现了hibernate 80%的功能,没实现的20%是计算脚本和数据库的解耦。复杂计算环境是它的弱项，比如：分布式计算、复杂计算、非数据
向网页中插入透明Flash的方法和技巧 dcj3sjt126com html Web Flash
将 Flash 作品插入网页的时候，我们有时候会需要将它设为透明，有时候我们需要在Flash的背面插入一些漂亮的图片，搭配出漂亮的效果……下面我们介绍一些将Flash插入网页中的一些透明的设置技巧。　　一、Swf透明、无坐标控制　　首先教大家最简单的插入Flash的代码，透明，无坐标控制：　　注意wmode="transparent"是控制Flash是否透明
ios UICollectionView的使用 dcj3sjt126com
UICollectionView的使用有两种方法，一种是继承UICollectionViewController，这个Controller会自带一个UICollectionView；另外一种是作为一个视图放在普通的UIViewController里面。个人更喜欢第二种。下面采用第二种方式简单介绍一下UICollectionView的使用。 1.UIViewController实现委托，代码如
Eos平台java公共逻辑蕃薯耀 Eos平台java公共逻辑 Eos平台 java公共逻辑
Eos平台java公共逻辑 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月1日 17:20:4
SpringMVC4零配置--Web上下文配置【MvcConfig】 hanqunfeng springmvc4
与SpringSecurity的配置类似，spring同样为我们提供了一个实现类WebMvcConfigurationSupport和一个注解@EnableWebMvc以帮助我们减少bean的声明。 applicationContext-MvcConfig.xml  <
解决ie和其他浏览器poi下载excel文件名乱码 jackyrong Excel
使用poi,做传统的excel导出，然后想在浏览器中，让用户选择另存为，保存用户下载的xls文件，这个时候，可能的是在ie下出现乱码（ie,9,10,11),但在firefox,chrome下没乱码，因此必须综合判断，编写一个工具类： /** * * @Title: pro
挥洒泪水的青春 lampcy 编程生活程序员
2015年2月28日，我辞职了，离开了相处一年的触控，转过身--挥洒掉泪水，毅然来到了兄弟连，背负着许多的不解、质疑——”你一个零基础、脑子又不聪明的人，还敢跨行业，选择Unity3D？“，”真是不自量力••••••“，”真是初生牛犊不怕虎•••••“，••••••我只是淡淡一笑，拎着行李----坐上了通向挥洒泪水的青春之地——兄弟连！这就是我青春的分割线，不后悔，只会去用泪水浇灌——已经来到
稳增长之中国股市两点意见-----严控做空，建立涨跌停版停牌重组机制 nannan408
对于股市，我们国家的监管还是有点拼的，但始终拼不过飞流直下的恐慌，为什么呢？笔者首先支持股市的监管。对于股市越管越荡的现象，笔者认为首先是做空力量超过了股市自身的升力，并且对于跌停停牌重组的快速反应还没建立好，上市公司对于股价下跌没有很好的利好支撑。我们来看美国和香港是怎么应对股灾的。美国是靠禁止重要股票做空，在
动态设置iframe高度(iframe高度自适应) Rainbow702 JavaScript iframe contentDocument 高度自适应局部刷新
如果需要对画面中的部分区域作局部刷新，大家可能都会想到使用ajax。但有些情况下，须使用在页面中嵌入一个iframe来作局部刷新。对于使用iframe的情况，发现有一个问题，就是iframe中的页面的高度可能会很高，但是外面页面并不会被iframe内部页面给撑开，如下面的结构： <div id="content"> <div id=&quo
用Rapael做图表 tntxia rap
function drawReport(paper,attr,data){ var width = attr.width; var height = attr.height; var max = 0; &nbs
HTML5 bootstrap2网页兼容（支持IE10以下） xiaoluode html5 bootstrap
<!DOCTYPE html> <html> <head lang="zh-CN"> <meta charset="UTF-8"> <meta http-equiv="X-UA-Compatible" content="IE=edge">