Những tính năng thường được sử dụng từ cây Parse trong quá trình phân loại trong NLP?


13

Tôi đang khám phá các loại cấu trúc cây phân tích khác nhau. Hai cấu trúc cây phân tích được biết đến rộng rãi là a) Cấu trúc cây phân tích dựa trên cấu thành và b) Cấu trúc cây phân tích dựa trên sự phụ thuộc.

Tôi có thể sử dụng tạo cả hai loại cấu trúc cây phân tích cú pháp bằng cách sử dụng gói Stanford NLP. Tuy nhiên, tôi không chắc làm thế nào để sử dụng các cấu trúc cây này cho nhiệm vụ phân loại của mình.

Ví dụ: Nếu tôi muốn phân tích tình cảm và muốn phân loại văn bản thành các lớp tích cực và tiêu cực, tôi có thể rút ra những đặc điểm nào từ cấu trúc cây phân tích cho nhiệm vụ phân loại của mình?

Câu trả lời:


9

Bằng cách sử dụng cây phân tích cú pháp, bạn chia câu của bạn thành nhiều phần. Giả sử, trong ví dụ về phân tích tình cảm, bạn có thể sử dụng các phần đó để gán một tình cảm tích cực / tiêu cực cho từng phần và sau đó lấy hiệu ứng tích lũy của các phần đó.

phân tích tình cảm

Hình ảnh này sẽ giúp bạn hiểu thêm. Nửa đầu có một tình cảm tiêu cực (chủ yếu là vì từ "khô") nhưng vì từ "nhưng" và cách sử dụng từ "được hưởng", tình cảm tiêu cực được chuyển thành một tình cảm tích cực.

Đối với việc sử dụng chúng, bạn có thể chỉ cần tạo một biểu diễn vectơ từ của các từ riêng lẻ trong câu và sử dụng nơ-ron thay cho các nút cha. Mỗi nơ-ron nên được kết nối với một nơ-ron khác thông qua các trọng số. Tất cả các nút lá sẽ là biểu diễn vectơ từ của các từ của câu. Tế bào thần kinh gốc trên cùng (trong trường hợp này là biểu tượng màu xanh + trên cùng) sẽ tạo ra một tình cảm tích cực / tiêu cực theo câu. Cấu trúc cây này có thể được đào tạo một cách có giám sát.

Đọc bài viết này để biết thêm thông qua sự hiểu biết.

Tín dụng hình ảnh: cs224.stanford.edu


1

Tôi nghĩ rằng sự phụ thuộc có thể được sử dụng để cải thiện tính chính xác của phân loại tình cảm của bạn. Hãy xem xét các ví dụ sau:

E1: Bill không phải là nhà khoa học

và giả định rằng "nhà khoa học" mã thông báo có một tình cảm tích cực trong một lĩnh vực cụ thể.

Biết được sự phụ thuộc phủ định (nhà khoa học, không phải) chúng ta có thể thấy rằng ví dụ trên có một tình cảm tiêu cực. Nếu không biết sự phụ thuộc này, có lẽ chúng ta sẽ phân loại câu là tích cực.

Một loại phụ thuộc khác có thể được sử dụng có thể theo cùng một cách để cải thiện độ chính xác của các phân loại.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.