DOM中为什么用getChildNodes()方法会出错

     在我们用DOM模型去解析XML文件,当调用到getChildNodes()方法时会报错。

   例如:

      DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();

      DocumentBuilder builder = factory.newDocumentBuilder();

      String path = this.getClass().getResource("/testxml/TestDOM/Link.xml").getFile();
        File f = new File(path);

       Document document = document = builder.parse(f);

       Element root = document.getDocumentElement();

       NodeList links = root.getChildNodes();      //这里要报错

       for(int i =0;i< links.getLength();i++)
        {
            Element link = (Element) links.item(i);
            System.out.println(link.getNodeName());

            NodeList elem = link.getChildNodes();
            for(int j = 0;j < elem.getLength();j++)
            {
                System.out.println(elem.item(j).getNodeName());
                System.out.println(elem.item(j).getTextContent());
            }
        }

       这是因为XML格式是一个很严谨的格式,解析器解析的时候会把父与子标签之间的缩进空格当成Node节点,所以调用getChildNodes()会出错。

       解决方案分为两步:

       (1)为XML文件编写一个DTD约束文件。

       (2)在实例化工厂后,设置工厂的属性为忽略XML文件标签间的空格。

即:在程序第三行添加 factory.setIgnoringElementContentWhitespace(true);

       上述两步缺一不可!

你可能感兴趣的:(xml,F#,J#)