По умолчанию пространство имен XML, JDOM и XPath
Я хочу использовать JDOM для чтения в XML файле, а затем использовать XPath для извлечения данных из документа JDOM. Он создает объект Document fine, но когда я использую XPath для запроса документа для списка элементов, я ничего не получаю.
Мой XML-документ имеет пространство имен по умолчанию, определенное в корневом элементе. Самое смешное, когда я удаляю пространство имен по умолчанию, он успешно запускает запрос XPath и возвращает те элементы, которые я хочу. Что еще я должен сделать, чтобы получить запрос XPath для получения результатов?
XML:
<?xml version="1.0" encoding="UTF-8"?>
<collection xmlns="http://www.foo.com">
<dvd id="A">
<title>Lord of the Rings: The Fellowship of the Ring</title>
<length>178</length>
<actor>Ian Holm</actor>
<actor>Elijah Wood</actor>
<actor>Ian McKellen</actor>
</dvd>
<dvd id="B">
<title>The Matrix</title>
<length>136</length>
<actor>Keanu Reeves</actor>
<actor>Laurence Fishburne</actor>
</dvd>
</collection>
Java:
public static void main(String args[]) throws Exception {
SAXBuilder builder = new SAXBuilder();
Document d = builder.build("xpath.xml");
XPath xpath = XPath.newInstance("collection/dvd");
xpath.addNamespace(d.getRootElement().getNamespace());
System.out.println(xpath.selectNodes(d));
}
Ответы
Ответ 1
XPath 1.0 не поддерживает концепцию пространства имен по умолчанию (XPath 2.0).
Любой нефиксированный тег всегда считается частью пространства имен без имени.
При использовании XPath 1.0 вам нужно что-то вроде этого:
public static void main(String args[]) throws Exception {
SAXBuilder builder = new SAXBuilder();
Document d = builder.build("xpath.xml");
XPath xpath = XPath.newInstance("x:collection/x:dvd");
xpath.addNamespace("x", d.getRootElement().getNamespaceURI());
System.out.println(xpath.selectNodes(d));
}
Ответ 2
У меня была аналогичная проблема, но мой был тем, что у меня была смесь XML-входов, некоторые из которых имели пространство имен, а другие - нет. Чтобы упростить мою проблему, я загрузил следующий фрагмент JDOM после загрузки документа.
for (Element el : doc.getRootElement().getDescendants(new ElementFilter())) {
if (el.getNamespace() != null) el.setNamespace(null);
}
После удаления всех пространств имен я смог использовать простую навигацию по стилю getChild ( "elname" ) или простые запросы XPath.
Я бы не рекомендовал эту технику как общее решение, но в моем случае это было определенно полезно.
Ответ 3
Вы также можете сделать следующее
/*[local-name() = 'collection']/*[local-name() = 'dvd']/
Здесь - список полезных запросов xpath.