Почему я получаю дополнительные текстовые узлы в качестве дочерних узлов корневого узла?

Я хочу напечатать дочерние элементы корневого узла. Это мой XML файл.

<?xml version="1.0"?>  <company> <staff id="1001"> <firstname>yong</firstname> <lastname>mook kim</lastname> <nickname>mkyong</nickname> < salary>100000</salary> </staff> <staff id="2001"> <firstname>low</firstname> <lastname>yin fong</lastname> <nickname>fong fong</nickname> <salary>200000</salary> </staff> </company>

По моему мнению, корневой узел - это "компания", а его дочерние узлы должны быть "персоналом" и "персоналом" (так как есть "штатные" узлы 2 раза). Но когда я пытаюсь получить их через мой код Java, я получаю 5 дочерних узлов. Откуда идут 3 дополнительных текстовых узла?

Код Java:

package com.training.xml; import java.io.File; import javax.xml.parsers.DocumentBuilder; import javax.xml.parsers.DocumentBuilderFactory; import org.w3c.dom.Document; import org.w3c.dom.Node; import org.w3c.dom.NodeList; public class ReadingXML { public static void main(String[] args) { try { File file=new File("D:\\TestFile.xml"); DocumentBuilderFactory dbFactory=DocumentBuilderFactory.newInstance(); DocumentBuilder dBuilder=dbFactory.newDocumentBuilder(); Document document=dBuilder.parse(file); document.getDocumentElement().normalize(); System.out.println("root element: "+document.getDocumentElement().getNodeName()); Node rootNode=document.getDocumentElement(); //saving root node in a variable. System.out.println("root: "+rootNode.getNodeName()); NodeList nList=rootNode.getChildNodes(); //to store the child nodes as node list. for(int i=0;i<nList.getLength();i++) { System.out.println("node name: "+nList.item(i).getNodeName() ); } } catch(Exception e) { e.printStackTrace(); } }

}

ВЫВОД:

root element: company root: company node name: #text node name: staff node name: #text node name: staff node name: #text

Почему здесь три текстовых узла?

Ответы

Ответ 1

Почему здесь три текстовых узла?

Это пробелы между дочерними элементами. Если вам нужны только дочерние элементы, вы должны просто игнорировать узлы других типов:

for (int i = 0;i < nList.getLength(); i++) {
    Node node = nList.item(i);
    if (node.getNodeType() == Node.ELEMENT_NODE) {
        System.out.println("node name: " + node.getNodeName());
    }
}

Или вы можете изменить свой документ, чтобы не иметь этого пробела.

Или вы можете использовать другой XML API, который позволяет легко запрашивать только элементы. (DOM API - это боль по-разному).

Если вы хотите игнорировать Text.isElementContentWhitespace содержимое элемента, вы можете использовать Text.isElementContentWhitespace.