Tôi cần phân tích cú pháp (phía máy chủ) số lượng lớn các trang HTML.
Tất cả chúng ta đều đồng ý rằng regexp không phải là cách để đi đến đây.
Đối với tôi, dường như javascript là cách phân tích cú pháp một trang HTML gốc, nhưng giả định đó dựa vào mã phía máy chủ có tất cả khả năng DOM mà javascript có bên trong trình duyệt.
Node.js có tích hợp sẵn khả năng đó không?
Có cách nào tốt hơn cho vấn đề này, phân tích cú pháp HTML ở phía máy chủ không?