Câu hỏi được gắn thẻ «html-parsing»

Phân tích cú pháp HTML là quá trình sử dụng tuần tự hóa một tài liệu HTML và tạo ra một biểu diễn mà bạn có thể làm việc theo chương trình - ví dụ: để trích xuất dữ liệu từ nó. Đặc tả HTML xác định một thuật toán tiêu chuẩn để phân tích cú pháp HTML, được triển khai trong tất cả các trình duyệt chính.



9
Phân tích chuỗi HTML bằng JS
Tôi đã tìm kiếm một giải pháp nhưng không có gì liên quan, vì vậy đây là vấn đề của tôi: Tôi muốn phân tích một chuỗi chứa văn bản HTML. Tôi muốn làm điều đó trong JavaScript. Tôi đã thử thư viện này nhưng có vẻ như nó phân …



7
Phân tích cú pháp HTML bằng Python
Tôi đang tìm kiếm một mô-đun phân tích cú pháp HTML cho Python có thể giúp tôi lấy các thẻ ở dạng danh sách / từ điển / đối tượng Python. Nếu tôi có một tài liệu của mẫu: <html> <head>Heading</head> <body attr1='val1'> <div class='container'> <div id='class'>Something here</div> <div>Something else</div> …




8
Cách trích xuất chuỗi theo một mẫu với grep, regex hoặc perl
Tôi có một tệp trông giống như sau: <table name="content_analyzer" primary-key="id"> <type="global" /> </table> <table name="content_analyzer2" primary-key="id"> <type="global" /> </table> <table name="content_analyzer_items" primary-key="id"> <type="global" /> </table> Tôi cần trích xuất bất kỳ thứ gì trong dấu ngoặc kép theo sau name=, tức là content_analyzer, content_analyzer2và content_analyzer_items. Tôi đang thực hiện …

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.