Cách đọc XML bằng XPath trong Java


Tôi muốn đọc dữ liệu XML bằng XPath trong Java, vì vậy đối với thông tin tôi đã thu thập được, tôi không thể phân tích cú pháp XML theo yêu cầu của tôi.

đây là những gì tôi muốn làm:

Nhận tệp XML từ trực tuyến qua URL của nó, sau đó sử dụng XPath để phân tích cú pháp, tôi muốn tạo hai phương thức trong đó. Một là trong đó tôi nhập id thuộc tính nút cụ thể và kết quả là tôi nhận được tất cả các nút con và thứ hai là giả sử tôi chỉ muốn nhận một giá trị nút con cụ thể

<?xml version="1.0"?>
  <topic name="Java">
  <topic name="PowerBuilder">
  <topic name="Javascript">
 <topic name="VBScript">

Trong ví dụ trên tôi muốn đọc tất cả các phần tử nếu tôi tìm kiếm thông qua @name và cũng là một hàm trong đó tôi chỉ muốn url từ @name 'Javascript' chỉ trả về một phần tử nút.

Đây liên kết sẽ cung cấp minh chứng rõ ràng đọc xml sử dụng xpath

Câu trả lời:


Bạn cần một cái gì đó dọc theo dòng này:

DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
DocumentBuilder builder = factory.newDocumentBuilder();
Document doc = builder.parse(<uri_as_string>);
XPathFactory xPathfactory = XPathFactory.newInstance();
XPath xpath = xPathfactory.newXPath();
XPathExpression expr = xpath.compile(<xpath_expression>);

Sau đó, bạn gọi expr.evaluate() chuyển qua trong tài liệu được xác định trong mã đó và loại trả về mà bạn đang mong đợi và truyền kết quả cho loại đối tượng của kết quả.

Nếu bạn cần trợ giúp với các biểu thức XPath cụ thể, có lẽ bạn nên hỏi nó dưới dạng các câu hỏi riêng biệt (trừ khi đó là câu hỏi của bạn ở nơi đầu tiên ở đây - tôi hiểu câu hỏi của bạn là cách sử dụng API trong Java).

Chỉnh sửa: (Phản hồi nhận xét): Biểu thức XPath này sẽ giúp bạn có văn bản của phần tử URL đầu tiên trong PowerBuilder:


Điều này sẽ giúp bạn có được thứ hai:


Bạn nhận được điều đó với mã này:

expr.evaluate(doc, XPathConstants.STRING);

Nếu bạn không biết có bao nhiêu URL trong một nút nhất định, thì bạn nên làm một cái gì đó như thế này:

XPathExpression expr = xpath.compile("/howto/topic[@name='PowerBuilder']/url");
NodeList nl = (NodeList) expr.evaluate(doc, XPathConstants.NODESET);

Và sau đó lặp qua NodeList.

Cảm ơn Yishai, tôi xóa câu hỏi của mình nhiều hơn, nếu tôi muốn nhận một giá trị cụ thể từ các nút con trên nút cha. làm thế nào sẽ được thực hiện? cảm ơn

là có thể để có được tất cả các chủ đề bất kể tên. Tôi muốn biết liệu có thể sử dụng ký tự đại diện hoặc tương tự cho @name và sau đó lặp qua tất cả các nút so sánh tên với một giá trị thực tế

@java_geek, nghe có vẻ như bạn đã sử dụng XPath và cần sử dụng bộ phân tích cú pháp XML dưới dạng Nút và Phần tử, nhưng tôi khuyên bạn nên giải thích trong một câu hỏi mới.

nhiều nhà máy xây dựng vật liệu tổng hợp plz.
Sebastian Graf

@Yishai Nó không hoạt động với xpath có tiền tố không gian tên.


Bạn có thể thử điều này.

Tài liệu XML

Lưu như employees.xml.

<?xml version="1.0" encoding="UTF-8"?>
    <Employee id="1">
        <role>Java Developer</role>
    <Employee id="2">
    <Employee id="3">
    <Employee id="4">

Lớp phân tích cú pháp

Lớp có các phương thức sau

  • Danh sách mục
  • Phương thức sẽ trả về Tên nhân viên cho ID đầu vào.
  • Phương thức sẽ trả về danh sách Tên nhân viên có tuổi lớn hơn tuổi đầu vào.
  • Một phương pháp sẽ trả về danh sách Tên nhân viên nữ.

Mã nguồn

import java.io.IOException;
import java.util.ArrayList;
import java.util.Arrays;
import java.util.List;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import javax.xml.xpath.XPath;
import javax.xml.xpath.XPathConstants;
import javax.xml.xpath.XPathExpression;
import javax.xml.xpath.XPathExpressionException;
import javax.xml.xpath.XPathFactory;

import org.w3c.dom.Document;
import org.w3c.dom.NodeList;
import org.xml.sax.SAXException;

public class Parser {

    public static void main(String[] args) {
        DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
        DocumentBuilder builder;
        Document doc = null;
        try {
            builder = factory.newDocumentBuilder();
            doc = builder.parse("employees.xml");

            // Create XPathFactory object
            XPathFactory xpathFactory = XPathFactory.newInstance();

            // Create XPath object
            XPath xpath = xpathFactory.newXPath();

            String name = getEmployeeNameById(doc, xpath, 4);
            System.out.println("Employee Name with ID 4: " + name);

            List<String> names = getEmployeeNameWithAge(doc, xpath, 30);
            System.out.println("Employees with 'age>30' are:" + Arrays.toString(names.toArray()));

            List<String> femaleEmps = getFemaleEmployeesName(doc, xpath);
            System.out.println("Female Employees names are:" +

        } catch (ParserConfigurationException | SAXException | IOException e) {


    private static List<String> getFemaleEmployeesName(Document doc, XPath xpath) {
        List<String> list = new ArrayList<>();
        try {
            //create XPathExpression object
            XPathExpression expr =
            //evaluate expression result on XML document
            NodeList nodes = (NodeList) expr.evaluate(doc, XPathConstants.NODESET);
            for (int i = 0; i < nodes.getLength(); i++)
        } catch (XPathExpressionException e) {
        return list;

    private static List<String> getEmployeeNameWithAge(Document doc, XPath xpath, int age) {
        List<String> list = new ArrayList<>();
        try {
            XPathExpression expr =
                xpath.compile("/Employees/Employee[age>" + age + "]/name/text()");
            NodeList nodes = (NodeList) expr.evaluate(doc, XPathConstants.NODESET);
            for (int i = 0; i < nodes.getLength(); i++)
        } catch (XPathExpressionException e) {
        return list;

    private static String getEmployeeNameById(Document doc, XPath xpath, int id) {
        String name = null;
        try {
            XPathExpression expr =
                xpath.compile("/Employees/Employee[@id='" + id + "']/name/text()");
            name = (String) expr.evaluate(doc, XPathConstants.STRING);
        } catch (XPathExpressionException e) {

        return name;


+1 nhưng tôi thấy một số dư thừa trong getphương pháp của bạn . Chỉ có chuỗi XPath thay đổi và hầu hết các phần còn lại của mã vẫn giữ nguyên. Có lẽ, một phương thức getValuesForXpath () là đủ.
Ravi Thapliyal


Bắt đầu ví dụ:

tập tin xml:

    <book year="2000">
        <title>Snow Crash</title>
        <author>Neal Stephenson</author>

    <book year="2005">
        <title>Burning Tower</title>
        <author>Larry Niven</author>
        <author>Jerry Pournelle</author>

    <book year="1995">
        <author>Neal Stephenson</author>

    <!-- more books... -->


Mã Java:

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;

import org.testng.annotations.DataProvider;
import org.testng.annotations.Test;
import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import org.xml.sax.SAXException;
import org.xml.sax.SAXParseException;

try {

    DocumentBuilderFactory docBuilderFactory = DocumentBuilderFactory.newInstance();
    DocumentBuilder docBuilder = docBuilderFactory.newDocumentBuilder();
    Document doc = docBuilder.parse (new File("c:\\tmp\\my.xml"));

    // normalize text representation
    System.out.println ("Root element of the doc is " + doc.getDocumentElement().getNodeName());

    NodeList listOfBooks = doc.getElementsByTagName("book");
    int totalBooks = listOfBooks.getLength();
    System.out.println("Total no of books : " + totalBooks);

    for(int i=0; i<listOfBooks.getLength() ; i++) {

        Node firstBookNode = listOfBooks.item(i);
        if(firstBookNode.getNodeType() == Node.ELEMENT_NODE) {

            Element firstElement = (Element)firstBookNode;                              
            System.out.println("Year :"+firstElement.getAttribute("year"));

            NodeList firstNameList = firstElement.getElementsByTagName("title");
            Element firstNameElement = (Element)firstNameList.item(0);

            NodeList textFNList = firstNameElement.getChildNodes();
            System.out.println("title : " + ((Node)textFNList.item(0)).getNodeValue().trim());
    }//end of for loop with s var
} catch (SAXParseException err) {
    System.out.println ("** Parsing error" + ", line " + err.getLineNumber () + ", uri " + err.getSystemId ());
    System.out.println(" " + err.getMessage ());
} catch (SAXException e) {
    Exception x = e.getException ();
    ((x == null) ? e : x).printStackTrace ();
} catch (Throwable t) {
    t.printStackTrace ();

bạn cũng có thể dùng thử howtodoinjava.com/2013/07/30/NH
Ran Adler

Điều này trả lời câu hỏi, nhưng không sử dụng XPath, được yêu cầu rõ ràng.
Olivier Grégoire

Nó phụ thuộc vào các yêu cầu. Giống như ví dụ này, nếu bắt buộc phải lấy nhóm nút thay vì nút cụ thể, thì câu trả lời này là tốt hơn.


Dưới đây là một ví dụ về xử lý xpath với vtd-xml ... để xử lý XML nặng, nó là thứ hai. đây là bài báo gần đây về chủ đề này Xử lý XML bằng Java - Điểm chuẩn hiệu suất

import com.ximpleware.*;

public class changeAttrVal {
    public  static  void main(String s[]) throws VTDException,java.io.UnsupportedEncodingException,java.io.IOException{
        VTDGen vg = new VTDGen();
        if (!vg.parseFile("input.xml", false))
        VTDNav vn = vg.getNav();
        AutoPilot ap = new AutoPilot(vn);
        XMLModifier xm = new XMLModifier(vn);
        ap.selectXPath("/*/place[@id=\"p14\" and   @initialMarking=\"2\"]/@initialMarking");
        int i=0;
            xm.updateToken(i+1, "499");// change initial marking from 2 to 499



Nếu bạn có một xml như dưới đây

    xmlns:d = "http://www.w3.org/2001/XMLSchema"
    xmlns:e = "http://schemas.xmlsoap.org/soap/envelope/"
    xmlns:wn0 = "http://systinet.com/xsd/SchemaTypes/"
    xmlns:i = "http://www.w3.org/2001/XMLSchema-instance">
        <n0:ForAnsiHeaderOperResponse xmlns:n0 = "http://systinet.com/wsdl/com/magicsoftware/ibolt/localhost/ForAnsiHeader/ForAnsiHeaderImpl#ForAnsiHeaderOper?KExqYXZhL2xhbmcvU3RyaW5nOylMamF2YS9sYW5nL1N0cmluZzs=">
            <response i:type = "d:string">12--abc--pqr</response>

và muốn giải nén xml dưới đây


Các mã dưới đây giúp đạt được cùng

public static void main(String[] args) {

    File fXmlFile = new File("C://Users//abhijitb//Desktop//Test.xml");
    DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
    Document document;
    Node result = null;
    try {
        document = dbf.newDocumentBuilder().parse(fXmlFile);
        XPath xPath = XPathFactory.newInstance().newXPath();
        String xpathStr = "//Envelope//Header";
        result = (Node) xPath.evaluate(xpathStr, document, XPathConstants.NODE);
    } catch (SAXException | IOException | ParserConfigurationException | XPathExpressionException
            | TransformerException e) {

private static String nodeToString(Node node) throws TransformerException {
    StringWriter buf = new StringWriter();
    Transformer xform = TransformerFactory.newInstance().newTransformer();
    xform.setOutputProperty(OutputKeys.OMIT_XML_DECLARATION, "yes");
    xform.transform(new DOMSource(node), new StreamResult(buf));
    return (buf.toString());

Bây giờ nếu bạn chỉ muốn xml như bên dưới


Bạn cần thay đổi

String xpathStr = "//Envelope//Header"; đến String xpathStr = "//Envelope//Header/*";


Điều này chỉ cho bạn cách

  1. Đọc trong tệp XML thành một DOM
  2. Lọc ra một bộ Nodes vớiXPath
  3. Thực hiện một hành động nhất định trên mỗi trích xuất Nodes.

Chúng tôi sẽ gọi mã với tuyên bố sau

processFilteredXml(xmlIn, xpathExpr,(node) -> {/*Do something...*/;});

Trong trường hợp của chúng tôi, chúng tôi muốn in một số creatorNamestừ book.xmlsử dụng "//book/creators/creator/creatorName"như xpath để thực hiện một printNodehành động trên mỗi Nút phù hợp vớiXPath .

Mã đầy đủ

public void printXml() {
    try (InputStream in = readFile("book.xml")) {
        processFilteredXml(in, "//book/creators/creator/creatorName", (node) -> {
            printNode(node, System.out);
    } catch (Exception e) {
        throw new RuntimeException(e);

private InputStream readFile(String yourSampleFile) {
    return Thread.currentThread().getContextClassLoader().getResourceAsStream(yourSampleFile);

private void processFilteredXml(InputStream in, String xpath, Consumer<Node> process) {
    Document doc = readXml(in);
    NodeList list = filterNodesByXPath(doc, xpath);
    for (int i = 0; i < list.getLength(); i++) {
        Node node = list.item(i);

public Document readXml(InputStream xmlin) {
    try {
        DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
        DocumentBuilder db = dbf.newDocumentBuilder();
        return db.parse(xmlin);
    } catch (Exception e) {
        throw new RuntimeException(e);

private NodeList filterNodesByXPath(Document doc, String xpathExpr) {
    try {
        XPathFactory xPathFactory = XPathFactory.newInstance();
        XPath xpath = xPathFactory.newXPath();
        XPathExpression expr = xpath.compile(xpathExpr);
        Object eval = expr.evaluate(doc, XPathConstants.NODESET);
        return (NodeList) eval;
    } catch (Exception e) {
        throw new RuntimeException(e);

private void printNode(Node node, PrintStream out) {
    try {
        Transformer transformer = TransformerFactory.newInstance().newTransformer();
        transformer.setOutputProperty(OutputKeys.INDENT, "yes");
        transformer.setOutputProperty(OutputKeys.OMIT_XML_DECLARATION, "yes");
        transformer.setOutputProperty("{http://xml.apache.org/xslt}indent-amount", "2");
        StreamResult result = new StreamResult(new StringWriter());
        DOMSource source = new DOMSource(node);
        transformer.transform(source, result);
        String xmlString = result.getWriter().toString();
    } catch (Exception e) {
        throw new RuntimeException(e);

Bản in

<creatorName>Fosmire, Michael</creatorName>

<creatorName>Wertz, Ruth</creatorName>

<creatorName>Purzer, Senay</creatorName>

Dành cho book.xml

      <creatorName>Fosmire, Michael</creatorName>
      <creatorName>Wertz, Ruth</creatorName>
      <creatorName>Purzer, Senay</creatorName>
    <title>Critical Engineering Literacy Test (CELT)</title>


Mở rộng dựa trên câu trả lời xuất sắc của @bluish và @Yishai, đây là cách bạn tạo NodeLists và các thuộc tính nút hỗ trợ các trình vòng lặp, tức là for(Node n: nodelist)giao diện.

Sử dụng nó như:

NodeList nl = ...
for(Node n : XmlUtil.asList(nl))

Node n = ...
for(Node attr : XmlUtil.asList(n.getAttributes())

Mật mã:

 * Converts NodeList to an iterable construct.
 * From: https://stackoverflow.com/a/19591302/779521
public final class XmlUtil {
    private XmlUtil() {}

    public static List<Node> asList(NodeList n) {
        return n.getLength() == 0 ? Collections.<Node>emptyList() : new NodeListWrapper(n);

    static final class NodeListWrapper extends AbstractList<Node> implements RandomAccess {
        private final NodeList list;

        NodeListWrapper(NodeList l) {
            this.list = l;

        public Node get(int index) {
            return this.list.item(index);

        public int size() {
            return this.list.getLength();

    public static List<Node> asList(NamedNodeMap n) {
        return n.getLength() == 0 ? Collections.<Node>emptyList() : new NodeMapWrapper(n);

    static final class NodeMapWrapper extends AbstractList<Node> implements RandomAccess {
        private final NamedNodeMap list;

        NodeMapWrapper(NamedNodeMap l) {
            this.list = l;

        public Node get(int index) {
            return this.list.item(index);

        public int size() {
            return this.list.getLength();


Đọc tệp XML bằng XPathFactory SAXParserFactoryStAX (JSR-173).

Sử dụng XPath nhận nút và dữ liệu con của nó.

public static void main(String[] args) {
    String xml = "<soapenv:Body xmlns:soapenv='http://schemas.xmlsoap.org/soap/envelope/'>"
            + "<Yash:Data xmlns:Yash='http://Yash.stackoverflow.com/Services/Yash'>"
            + "<Yash:Tags>Java</Yash:Tags><Yash:Tags>Javascript</Yash:Tags><Yash:Tags>Selenium</Yash:Tags>"
            + "<Yash:Top>javascript</Yash:Top><Yash:User>Yash-777</Yash:User>"
            + "</Yash:Data></soapenv:Body>";
    String jsonNameSpaces = "{'soapenv':'http://schemas.xmlsoap.org/soap/envelope/',"
            + "'Yash':'http://Yash.stackoverflow.com/Services/Yash'}";
    String xpathExpression = "//Yash:Data";

    Document doc1 = getDocument(false, "fileName", xml);
    getNodesFromXpath(doc1, xpathExpression, jsonNameSpaces);
    System.out.println("\n===== ***** =====");
    Document doc2 = getDocument(true, "./books.xml", xml);
    getNodesFromXpath(doc2, "//person", "{}");
static Document getDocument( boolean isFileName, String fileName, String xml ) {
    Document doc = null;
    try {

        DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();

        DocumentBuilder builder = factory.newDocumentBuilder();
        if( isFileName ) {
            File file = new File( fileName );
            FileInputStream stream = new FileInputStream( file );
            doc = builder.parse( stream );
        } else {
            doc = builder.parse( string2Source( xml ) );
    } catch (SAXException | IOException e) {
    } catch (ParserConfigurationException e) {
    return doc;

public static void getNodesFromXpath( Document doc, String xpathExpression, String jsonNameSpaces ) {
    try {
        XPathFactory xpf = XPathFactory.newInstance();
        XPath xpath = xpf.newXPath();

        JSONObject namespaces = getJSONObjectNameSpaces(jsonNameSpaces);
        if ( namespaces.size() > 0 ) {
            NamespaceContextImpl nsContext = new NamespaceContextImpl();

            Iterator<?> key = namespaces.keySet().iterator();
            while (key.hasNext()) { // Apache WebServices Common Utilities
                String pPrefix = key.next().toString();
                String pURI = namespaces.get(pPrefix).toString();
                nsContext.startPrefixMapping(pPrefix, pURI);
            xpath.setNamespaceContext(nsContext );

        XPathExpression compile = xpath.compile(xpathExpression);
        NodeList nodeList = (NodeList) compile.evaluate(doc, XPathConstants.NODESET);
    } catch (XPathExpressionException e) {

static void displayNodeList( NodeList nodeList ) {
    for (int i = 0; i < nodeList.getLength(); i++) {
        Node node = nodeList.item(i);
        String NodeName = node.getNodeName();

        NodeList childNodes = node.getChildNodes();
        if ( childNodes.getLength() > 1 ) {
            for (int j = 0; j < childNodes.getLength(); j++) {

                Node child = childNodes.item(j);
                short nodeType = child.getNodeType();
                if ( nodeType == 1 ) {
                    System.out.format( "\n\t Node Name:[%s], Text[%s] ", child.getNodeName(), child.getTextContent() );
        } else {
            System.out.format( "\n Node Name:[%s], Text[%s] ", NodeName, node.getTextContent() );

static InputSource string2Source( String str ) {
    InputSource inputSource = new InputSource( new StringReader( str ) );
    return inputSource;
static JSONObject getJSONObjectNameSpaces( String jsonNameSpaces ) {
    if(jsonNameSpaces.indexOf("'") > -1)    jsonNameSpaces = jsonNameSpaces.replace("'", "\"");
    JSONParser parser = new JSONParser();
    JSONObject namespaces = null;
    try {
        namespaces = (JSONObject) parser.parse(jsonNameSpaces);
    } catch (ParseException e) {
    return namespaces;

Tài liệu XML

<?xml version="1.0" encoding="UTF-8"?>

Đặt ra cho XPathExpression đã cho:

String xpathExpression = "//person/first";
 Node Name:[first], Text[Yash] 
 Node Name:[first], Text[Bill] 
 Node Name:[first], Text[Steve] */

String xpathExpression = "//person";
     Node Name:[first], Text[Yash] 
     Node Name:[last], Text[M] 
     Node Name:[age], Text[22] 
     Node Name:[first], Text[Bill] 
     Node Name:[last], Text[Gates] 
     Node Name:[age], Text[46] 
     Node Name:[first], Text[Steve] 
     Node Name:[last], Text[Jobs] 
     Node Name:[age], Text[40] */

String xpathExpression = "//Yash:Data";
     Node Name:[Yash:Tags], Text[Java] 
     Node Name:[Yash:Tags], Text[Javascript] 
     Node Name:[Yash:Tags], Text[Selenium] 
     Node Name:[Yash:Top], Text[javascript] 
     Node Name:[Yash:User], Text[Yash-777] */

Xem liên kết này để thực hiện riêng của chúng tôi vềNamespaceContext

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.