Почему я получаю дополнительные текстовые узлы в качестве дочерних узлов корневого узла?
Я хочу напечатать дочерние элементы корневого узла. Это мой XML файл.
<?xml version="1.0"?>
<!-- Hi -->
<company>
<staff id="1001">
<firstname>yong</firstname>
<lastname>mook kim</lastname>
<nickname>mkyong</nickname>
< salary>100000</salary>
</staff>
<staff id="2001">
<firstname>low</firstname>
<lastname>yin fong</lastname>
<nickname>fong fong</nickname>
<salary>200000</salary>
</staff>
</company>
По моему мнению, корневой узел - это "компания", а его дочерние узлы должны быть "персоналом" и "персоналом" (так как есть "штатные" узлы 2 раза). Но когда я пытаюсь получить их через мой код Java, я получаю 5 дочерних узлов. Откуда идут 3 дополнительных текстовых узла?
Код Java:
package com.training.xml;
import java.io.File;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import org.w3c.dom.Document;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
public class ReadingXML {
public static void main(String[] args) {
try {
File file=new File("D:\\TestFile.xml");
DocumentBuilderFactory dbFactory=DocumentBuilderFactory.newInstance();
DocumentBuilder dBuilder=dbFactory.newDocumentBuilder();
Document document=dBuilder.parse(file);
document.getDocumentElement().normalize();
System.out.println("root element: "+document.getDocumentElement().getNodeName());
Node rootNode=document.getDocumentElement(); //saving root node in a variable.
System.out.println("root: "+rootNode.getNodeName());
NodeList nList=rootNode.getChildNodes(); //to store the child nodes as node list.
for(int i=0;i<nList.getLength();i++)
{
System.out.println("node name: "+nList.item(i).getNodeName() );
}
}
catch(Exception e)
{
e.printStackTrace();
}
}
}
ВЫВОД:
root element: company
root: company
node name: #text
node name: staff
node name: #text
node name: staff
node name: #text
Почему здесь три текстовых узла?
Ответы
Ответ 1
Почему здесь три текстовых узла?
Это пробелы между дочерними элементами. Если вам нужны только дочерние элементы, вы должны просто игнорировать узлы других типов:
for (int i = 0;i < nList.getLength(); i++) {
Node node = nList.item(i);
if (node.getNodeType() == Node.ELEMENT_NODE) {
System.out.println("node name: " + node.getNodeName());
}
}
Или вы можете изменить свой документ, чтобы не иметь этого пробела.
Или вы можете использовать другой XML API, который позволяет легко запрашивать только элементы. (DOM API - это боль по-разному).
Если вы хотите игнорировать Text.isElementContentWhitespace
содержимое элемента, вы можете использовать Text.isElementContentWhitespace
.