Sử dụng Vowpal Wợi cho NER


9

Vowpal Wmus (VW) rõ ràng hỗ trợ chức năng gắn thẻ theo trình tự thông qua SEARN . Vấn đề là tôi không thể tìm thấy bất cứ nơi nào danh sách tham số chi tiết với lời giải thích và với một số ví dụ. Điều tốt nhất tôi có thể tìm thấy là mục blog của Zinkov với một ví dụ rất ngắn. Các trang wiki chính hầu như không đề cập đến SEARN.

Trong mã nguồn đã kiểm tra, tôi tìm thấy thư mục demo với một số dữ liệu mẫu NER. Thật không may, tập lệnh chạy tất cả các bài kiểm tra không cho thấy cách chạy trên dữ liệu này. Ít nhất nó cũng đủ thông tin để xem định dạng dự kiến ​​là gì: gần giống với định dạng dữ liệu tiêu chuẩn của VW, ngoại trừ các mục được phân tách bằng các dòng trống (điều này rất quan trọng).

Hiểu biết hiện tại của tôi là chạy lệnh sau:

cat train.txt | vw -c --passes 10 --searn 25 --searn_task sequence \
--searn_passes_per_policy 2 -b 30 -f twpos.vw

Ở đâu

--searn 25 - tổng số nhãn NER (?)

--searn_task sequence - tác vụ gắn thẻ trình tự (?)

--searn_passes_per_policy 2 - không rõ nó làm gì

Các thông số khác là tiêu chuẩn cho VW và không cần giải thích thêm. Có lẽ có nhiều thông số cụ thể hơn cho SEARN? Tầm quan trọng và tác động của họ là gì? Làm thế nào để điều chỉnh chúng? Bất kỳ quy tắc của ngón tay cái?

Bất kỳ con trỏ đến ví dụ sẽ được đánh giá cao.

Câu trả lời:


Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.