Đặt DocumentBuilder.parse bỏ qua các tham chiếu DTD


Khi tôi phân tích cú pháp tệp xml (biến f) trong phương pháp này, tôi gặp lỗi

C: \ Documents and Settings \ joe \ Desktop \ aicpcudev \ OnlineModule \ map.dtd (Hệ thống không thể tìm thấy đường dẫn được chỉ định)

Tôi biết tôi không có dtd, và tôi cũng không cần nó. Làm cách nào để phân tích cú pháp đối tượng Tệp này thành đối tượng Tài liệu trong khi bỏ qua lỗi tham chiếu DTD?

private static Document getDoc(File f, String docId) throws Exception{
    DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
    DocumentBuilder db = dbf.newDocumentBuilder();
    Document doc = db.parse(f);

    return doc;

Câu trả lời:


Cách tiếp cận tương tự với cách được @anjanb đề xuất

    builder.setEntityResolver(new EntityResolver() {
        public InputSource resolveEntity(String publicId, String systemId)
                throws SAXException, IOException {
            if (systemId.contains("foo.dtd")) {
                return new InputSource(new StringReader(""));
            } else {
                return null;

Tôi thấy rằng chỉ cần trả lại một InputSource trống cũng hoạt động tốt?

Thử cài đặt các tính năng trên DocumentBuilderFactory:

DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();

dbf.setFeature("http://xml.org/sax/features/namespaces", false);
dbf.setFeature("http://xml.org/sax/features/validation", false);
dbf.setFeature("http://apache.org/xml/features/nonvalidating/load-dtd-grammar", false);
dbf.setFeature("http://apache.org/xml/features/nonvalidating/load-external-dtd", false);

DocumentBuilder db = dbf.newDocumentBuilder();

Cuối cùng, tôi nghĩ rằng các tùy chọn dành riêng cho việc triển khai trình phân tích cú pháp. Đây là một số tài liệu cho Xerces2 nếu điều đó hữu ích.

Tôi đã tìm thấy sự cố trong đó tệp DTD nằm trong tệp jar cùng với XML. Tôi đã giải quyết vấn đề dựa trên các ví dụ ở đây, như sau: -

DocumentBuilder db = dbf.newDocumentBuilder();
db.setEntityResolver(new EntityResolver() {
    public InputSource resolveEntity(String publicId, String systemId) throws SAXException, IOException {
        if (systemId.contains("doc.dtd")) {
             InputStream dtdStream = MyClass.class
             return new InputSource(dtdStream);
         } else {
             return null;


Nguồn XML (Với DTD)


Triển khai Java DOM để chấp nhận XML ở trên dưới dạng Chuỗi và loại bỏ khai báo DTD

public Document removeDTDFromXML(String payload) throws Exception {

    System.out.println("### Payload received in XMlDTDRemover: " + payload);

    Document doc = null;
    DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
    try {

        dbf.setFeature("http://xml.org/sax/features/namespaces", false);
        dbf.setFeature("http://xml.org/sax/features/validation", false);
        dbf.setFeature("http://apache.org/xml/features/nonvalidating/load-dtd-grammar", false);
        dbf.setFeature("http://apache.org/xml/features/nonvalidating/load-external-dtd", false);

        DocumentBuilder db = dbf.newDocumentBuilder();

        InputSource is = new InputSource();
        is.setCharacterStream(new StringReader(payload));
        doc = db.parse(is); 

    } catch (ParserConfigurationException e) {
        System.out.println("Parse Error: " + e.getMessage());
        return null;
    } catch (SAXException e) {
        System.out.println("SAX Error: " + e.getMessage());
        return null;
    } catch (IOException e) {
        System.out.println("IO Error: " + e.getMessage());
        return null;
    return doc;


XML đích (Không có DTD)



Tôi biết tôi không có dtd, và tôi cũng không cần nó.

Tôi nghi ngờ về tuyên bố này; tài liệu của bạn có chứa bất kỳ tham chiếu thực thể nào không? Nếu vậy, bạn chắc chắn cần DTD.

Dù sao, cách thông thường để ngăn điều này xảy ra là sử dụng một danh mục XML để xác định một đường dẫn cục bộ cho "map.dtd".


người dùng ddssot trên bài đăng đó nói

myDocumentBuilder.setEntityResolver(new EntityResolver() {
          public InputSource resolveEntity(java.lang.String publicId, java.lang.String systemId)
                 throws SAXException, java.io.IOException
            if (publicId.equals("--myDTDpublicID--"))
              // this deactivates the open office DTD
              return new InputSource(new ByteArrayInputStream("<?xml version='1.0' encoding='UTF-8'?>".getBytes()));
            else return null;

Người dùng đề cập thêm "Như bạn có thể thấy, khi trình phân tích cú pháp truy cập vào DTD, trình phân giải thực thể được gọi. Tôi nhận ra DTD của mình bằng ID cụ thể của nó và trả về một tài liệu XML trống thay vì DTD thực, dừng tất cả xác thực ..."

Hi vọng điêu nay co ich.


Tôi đang làm việc với sonarqube và sonarlint cho nhật thực đã cho tôi thấy XML không đáng tin cậy sẽ được phân tích cú pháp mà không cần giải quyết dữ liệu bên ngoài (ink: S2755)

Tôi đã quản lý để giải quyết nó bằng cách sử dụng:

    factory = DocumentBuilderFactory.newInstance();

    factory.setFeature("http://apache.org/xml/features/disallow-doctype-decl", true);

    // If you can't completely disable DTDs, then at least do the following:
    // Xerces 1 - http://xerces.apache.org/xerces-j/features.html#external-general-entities
    // Xerces 2 - http://xerces.apache.org/xerces2-j/features.html#external-general-entities
    // JDK7+ - http://xml.org/sax/features/external-general-entities
    factory.setFeature("http://xml.org/sax/features/external-general-entities", false);

    // Xerces 1 - http://xerces.apache.org/xerces-j/features.html#external-parameter-entities
    // Xerces 2 - http://xerces.apache.org/xerces2-j/features.html#external-parameter-entities
    // JDK7+ - http://xml.org/sax/features/external-parameter-entities
    factory.setFeature("http://xml.org/sax/features/external-parameter-entities", false);

    // Disable external DTDs as well
    factory.setFeature("http://apache.org/xml/features/nonvalidating/load-external-dtd", false);

    // and these as well, per Timothy Morgan's 2014 paper: "XML Schema, DTD, and Entity Attacks"
