Как получить конкретные XML-элементы с определенным значением атрибута?

Я пытаюсь проанализировать XML файл из URL-адреса, взяв все элементы "<Type>", где находится параметр type_id = "4218"??

XML-документ:

<BSQCUBS Version="0.04" Date="Fri Dec 9 11:43:29 GMT 2011" MachineDate="Fri, 09 Dec 2011 11:43:29 +0000">
  <Class class_id="385">
    <Title>Football Matches</Title>
    <Type type_id="4264" type_minbet="0.1" type_maxbet="2000.0">
      ...
    </Type>
    <Type type_id="5873" type_minbet="0" type_maxbet="0">
      ...
    </Type>
    <Type type_id="4725" type_minbet="0.1" type_maxbet="2000.0">
      ...
    </Type>
    <Type type_id="4218" type_minbet="0.1" type_maxbet="2000.0">
      ...
    </Type>
    <Type type_id="4221" type_minbet="0.1" type_maxbet="2000.0">
      ...
    </Type>
    <Type type_id="4218" type_minbet="0.1" type_maxbet="2000.0">
      ...
    </Type>
    <Type type_id="4299" type_minbet="0.1" type_maxbet="2000.0">
      ...
    </Type>
  </Class>
</BSQCUBS>

Вот мой код Java:

 DocumentBuilder db = dbf.newDocumentBuilder();
 Document doc = db.parse(new URL("http://cubs.bluesq.com/cubs/cubs.php?action=getpage&thepage=385.xml").openStream());

 doc.getDocumentElement().normalize();

 NodeList nodeList = doc.getElementsByTagName("Type");
 System.out.println("ukupno:"+nodeList.getLength());
 if (nodeList != null && nodeList.getLength() > 0) {
   for (int j = 0; j < nodeList.getLength(); j++) {
     Element el = (org.w3c.dom.Element) nodeList.item(j);
     type_id = Integer.parseInt(el.getAttribute("type_id"));
     System.out.println("type id:"+type_id);
   }
 }

Этот код дает мне все элементы, я не хочу этого, я хочу, чтобы все элементы, где атрибут type_id = "4218"!

Ответы

Ответ 1

XPath - это правильный выбор для вас:

DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
DocumentBuilder builder = factory.newDocumentBuilder();
Document doc = builder.parse("<Your xml doc uri>");
XPathFactory xPathfactory = XPathFactory.newInstance();
XPath xpath = xPathfactory.newXPath();
XPathExpression expr = xpath.compile("//Type[@type_id=\"4218\"]");
NodeList nl = (NodeList) expr.evaluate(doc, XPathConstants.NODESET);

И итерация через nl

Ответ 2

В вашем цикле отсутствует условие:

 if(nodeList != null && nodeList.getLength() > 0){
     for (int j = 0; j < nodeList.getLength(); j++) {
         Element el = (org.w3c.dom.Element) nodeList.item(j);
         if (el.hasAttribute("type_id") && el.getAttribute("type_id").equals("4218")) {
              type_id = Integer.parseInt(el.getAttribute("type_id"));

              System.out.println("type id:"+type_id);
         }
     }
}

Также вам не нужно проверять, является ли NodeList, возвращаемое getElementsByTagName, нулевым, поэтому вы можете удалить if до цикла.

В общем случае вам может быть лучше использовать XPath.

Ответ 3

Вы можете использовать XPath.XPath используется для навигации по элементам и атрибутам в XML-документе. Есть несколько хороших реализаций Xpath в Java.

Для примера

XPath xpath = XPathFactory.newInstance().newXPath();
XPathExpression expr = xpath.compile("//Type[@type_id=\"4218\"]");
Object exprResult = expr.evaluate(doc, XPathConstants.NODESET);
NodeList nodeList = (NodeList) exprResult;

Ответ 4

Следующий XPath предоставит вам элементы типа, которые вы после:

/BSQCUBS/Class/Type[@type_id=4218]

Таким образом, вы можете использовать следующий код Java, чтобы получить NodeList, который включает только следующие:

XPathExpression expr = xpath.compile("/BSQCUBS/Class/Type[@type_id=4218]");
NodeList nl = (NodeList)expr.evaluate(doc, XPathConstants.NODESET);

Ответ 5

Следуйте приведенному ниже ответу @soulcheck и по возможности поставьте оператор break..., который может улучшить ваш поиск.

 if(nodeList != null && nodeList.getLength() > 0){
 for (int j = 0; j < nodeList.getLength(); j++) {
     Element el = (org.w3c.dom.Element) nodeList.item(j);
     if (el.hasAttribute("type_id") && el.getAttribute("type_id").equals("4218")) {
          type_id = Integer.parseInt(el.getAttribute("type_id"));

          System.out.println("type id:"+type_id);
          break;

     }
 }

}