Gần đây tôi đã bắt đầu thử nghiệm xử lý ngôn ngữ tự nhiên (NLP) bằng CoreNLP của Stanford và tôi tự hỏi một số cách tiêu chuẩn để lưu trữ dữ liệu được phân tích cú pháp NLP cho một cái gì đó như ứng dụng khai thác văn bản là gì?
Một cách tôi nghĩ có thể thú vị là lưu trữ trẻ em dưới dạng danh sách kề và sử dụng tốt các truy vấn đệ quy (Postgres hỗ trợ điều này và tôi thấy nó hoạt động rất tốt).
Nhưng tôi cho rằng có lẽ có nhiều cách tiêu chuẩn để làm điều này tùy thuộc vào loại phân tích nào đang được thực hiện đã được áp dụng bởi những người làm việc trong lĩnh vực này trong nhiều năm qua. Vì vậy, các chiến lược kiên trì tiêu chuẩn cho dữ liệu được phân tích cú pháp NLP là gì và chúng được sử dụng như thế nào?