Самый быстрый и оптимизированный способ чтения xml
У меня есть этот ниже XML файл
<book>
<person>
<first>Kiran</first>
<last>Pai</last>
<age>22</age>
</person>
<person>
<first>Bill</first>
<last>Gates</last>
<age>46</age>
</person>
<person>
<first>Steve</first>
<last>Jobs</last>
<age>40</age>
</person>
</book>
теперь программа Java для чтения данных из XML файла показана ниже.
import java.io.File;
import org.w3c.dom.Document;
import org.w3c.dom.*;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.DocumentBuilder;
import org.xml.sax.SAXException;
import org.xml.sax.SAXParseException;
public class ReadAndPrintXMLFile{
public static void main (String argv []){
try {
DocumentBuilderFactory docBuilderFactory = DocumentBuilderFactory.newInstance();
DocumentBuilder docBuilder = docBuilderFactory.newDocumentBuilder();
Document doc = docBuilder.parse (new File("book.xml"));
// normalize text representation
doc.getDocumentElement ().normalize ();
System.out.println ("Root element of the doc is " +
doc.getDocumentElement().getNodeName());
NodeList listOfPersons = doc.getElementsByTagName("person");
int totalPersons = listOfPersons.getLength();
System.out.println("Total no of people : " + totalPersons);
for(int s=0; s<listOfPersons.getLength() ; s++){
Node firstPersonNode = listOfPersons.item(s);
if(firstPersonNode.getNodeType() == Node.ELEMENT_NODE){
Element firstPersonElement = (Element)firstPersonNode;
//-------
NodeList firstNameList = firstPersonElement.getElementsByTagName("first");
Element firstNameElement = (Element)firstNameList.item(0);
NodeList textFNList = firstNameElement.getChildNodes();
System.out.println("First Name : " +
((Node)textFNList.item(0)).getNodeValue().trim());
//-------
NodeList lastNameList = firstPersonElement.getElementsByTagName("last");
Element lastNameElement = (Element)lastNameList.item(0);
NodeList textLNList = lastNameElement.getChildNodes();
System.out.println("Last Name : " +
((Node)textLNList.item(0)).getNodeValue().trim());
//----
NodeList ageList = firstPersonElement.getElementsByTagName("age");
Element ageElement = (Element)ageList.item(0);
NodeList textAgeList = ageElement.getChildNodes();
System.out.println("Age : " +
((Node)textAgeList.item(0)).getNodeValue().trim());
//------
}//end of if clause
}//end of for loop with s var
}catch (SAXParseException err) {
System.out.println ("** Parsing error" + ", line "
+ err.getLineNumber () + ", uri " + err.getSystemId ());
System.out.println(" " + err.getMessage ());
}catch (SAXException e) {
Exception x = e.getException ();
((x == null) ? e : x).printStackTrace ();
}catch (Throwable t) {
t.printStackTrace ();
}
//System.exit (0);
}//end of main
}
и результат был...
Root element of the doc is book
Total no of people : 3
First Name : Kiran
Last Name : Pai
Age : 22
First Name : Bill
Last Name : Gates
Age : 46
First Name : Steve
Last Name : Jobs
Age : 40
Теперь мой запрос, пожалуйста, сообщите, есть ли какой-либо другой способ, который быстрее всего читает этот xml, я смотрел посты, прошу посоветовать..!!
Ответы
Ответ 1
Используя ReadAndPrintXMLFileWithStAX
ниже, когда я сравниваю с ReadAndPrintXMLFileWithSAX
с ответом заданным gontard, метод StAX работает быстрее. Мой тест включал запуск кода примера 500000
раз на JDK 1.7.0_07 для Mac.
ReadAndPrintXMLFileWithStAX: 103 seconds
ReadAndPrintXMLFileWithSAX: 125 seconds
ReadAndPrintXMLFileWithStAX (с использованием Java SE 7)
Ниже приведен более оптимизированный пример StAX (JSR-173) с использованием XMLStreamReader
вместо XMLEventReader
.
import java.io.FileInputStream;
import java.io.InputStream;
import javax.xml.stream.*;
public class ReadAndPrintXMLFileWithStAX {
public static void main(String argv[]) throws Exception {
XMLInputFactory inputFactory = XMLInputFactory.newInstance();
InputStream in = new FileInputStream("book.xml");
XMLStreamReader streamReader = inputFactory.createXMLStreamReader(in);
streamReader.nextTag(); // Advance to "book" element
streamReader.nextTag(); // Advance to "person" element
int persons = 0;
while (streamReader.hasNext()) {
if (streamReader.isStartElement()) {
switch (streamReader.getLocalName()) {
case "first": {
System.out.print("First Name : ");
System.out.println(streamReader.getElementText());
break;
}
case "last": {
System.out.print("Last Name : ");
System.out.println(streamReader.getElementText());
break;
}
case "age": {
System.out.print("Age : ");
System.out.println(streamReader.getElementText());
break;
}
case "person" : {
persons ++;
}
}
}
streamReader.next();
}
System.out.print(persons);
System.out.println(" persons");
}
}
Выход
First Name : Kiran
Last Name : Pai
Age : 22
First Name : Bill
Last Name : Gates
Age : 46
First Name : Steve
Last Name : Jobs
Age : 40
3 persons
Ответ 2
Если ваши действия важны в вашем случае, вы должны предпочесть SAX или StAX (http://en.wikipedia.org/wiki/StAX) в DOM.
С DOM
, в первый раз файл XML
анализируется в объектной модели, тогда вы можете задать его. Итак, для вас алгоритм состоит из двух проходов.
С SAX
во время разбора вызывается несколько обратных вызовов (startDocument
, endElement
...), SAX
- это основанная на события или push-модель.
С помощью StAX
вы контролируете разбор. Вы перемещаете курсор из одного элемента в другой. Это модель тяги.
С файлом, содержащим 32910000 человек, я сравниваю свою версию с SAX
с ответом (Blaise Doughan) с StAX
. Я удаляю все System.out.println
instrusctions. Моя программа заняла 106 секунд, чтобы прочитать весь файл, а другая заняла 94 секунды.
Я полагаю, что SAX
работает медленнее, потому что все callback
вызывается, даже если они ничего не делают (модель push), тогда как при StAX курсор перемещается только на "interresting" элементы (модель pull).
Например, с помощью java 7:
import java.io.File;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;
import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;
public class ReadAndPrintXMLFileWithSax {
public static void main(String[] args) throws Exception {
SAXParserFactory fabrique = SAXParserFactory.newInstance();
SAXParser parser = fabrique.newSAXParser();
File file = new File("book.xml");
BookHandler handler = new BookHandler();
parser.parse(file, handler);
}
public static class BookHandler extends DefaultHandler {
private int count = 0;
private StringBuilder buffer;
@Override
public void startElement(String uri, String localName, String qName,
Attributes attributes) throws SAXException {
switch (qName) {
case "person":
count++;
break;
case "first":
buffer = new StringBuilder("First Name : ");
break;
case "last":
buffer = new StringBuilder("Last Name : ");
break;
case "age":
buffer = new StringBuilder("Age : ");
break;
}
}
@Override
public void characters(char[] ch, int start, int length)
throws SAXException {
String content = new String(ch, start, length);
if (buffer != null)
buffer.append(content);
}
@Override
public void endElement(String uri, String localName, String qName)
throws SAXException {
switch (qName) {
case "first":
case "last":
case "age":
System.out.println(buffer.toString());
break;
}
}
@Override
public void endDocument() throws SAXException {
System.out.println(count + " persons");
}
}
}
Ответ 3
Пример Stax
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.InputStream;
import javax.xml.stream.XMLEventReader;
import javax.xml.stream.XMLInputFactory;
import javax.xml.stream.XMLStreamException;
import javax.xml.stream.events.StartElement;
import javax.xml.stream.events.XMLEvent;
public class ReadAndPrintXMLFile {
public static void main(String argv []) {
String inputFile = "c:/source/book.xml";
try {
// First create a new XMLInputFactory
XMLInputFactory inputFactory = XMLInputFactory.newInstance();
// Setup a new eventReader
InputStream in = new FileInputStream(inputFile);
XMLEventReader eventReader = inputFactory.createXMLEventReader(in);
// Read the XML document
while (eventReader.hasNext()) {
XMLEvent event = eventReader.nextEvent();
if (event.isStartElement()) {
StartElement startElement = event.asStartElement();
if (startElement.getName().getLocalPart().equals("first")) {
event = eventReader.nextEvent();
StringBuilder fName = new StringBuilder();
while (!event.isEndElement()) {
fName.append(event.asCharacters().getData());
event = eventReader.nextEvent();
}
System.out.println("First Name : " + fName);
event = eventReader.nextEvent();
continue;
}
if (startElement.getName().getLocalPart().equals("last")) {
event = eventReader.nextEvent();
StringBuilder lName = new StringBuilder();
while (!event.isEndElement()) {
lName.append(event.asCharacters().getData());
event = eventReader.nextEvent();
}
System.out.println("Last Name : " + lName);
event = eventReader.nextEvent();
continue;
}
if (startElement.getName().getLocalPart().equals("age")) {
event = eventReader.nextEvent();
StringBuilder age = new StringBuilder();
while (!event.isEndElement()) {
age.append(event.asCharacters().getData());
event = eventReader.nextEvent();
}
System.out.println("Age : " + age);
event = eventReader.nextEvent();
continue;
}
}
}
} catch (FileNotFoundException e) {
System.out.println("File not Found: " + inputFile);
} catch (XMLStreamException e) {
e.printStackTrace();
}
}
}
Вывод:
First Name : Kiran
Last Name : Pai
Age : 22
First Name : Bill
Last Name : Gates
Age : 46
First Name : Steve
Last Name : Jobs
Age : 40