Sự phức tạp của các vấn đề xử lý ngôn ngữ tự nhiên [đóng]

7

Những vấn đề xử lý ngôn ngữ tự nhiên nào là NP-Complete hoặc NP-Hard?

Tôi đã tìm kiếm tự nhiên-lang-chế biến và lý thuyết phức tạp các thẻ (và các thẻ phức tạp liên quan), nhưng không đưa ra bất kỳ kết quả nào.

Không có câu hỏi NLP nào được khuyến nghị là hữu ích, gần nhất là:

Các danh sách Wikipedia của các vấn đề NP-đầy đủ không liệt kê bất kỳ kết quả phức tạp cho NLP.

Dẫn đầu duy nhất tôi tìm thấy là bài báo Sự phức tạp lý thuyết và hiệu quả trong xử lý ngôn ngữ tự nhiên của J. Morin (1995).

Bất kỳ trợ giúp hoặc con trỏ được đánh giá cao!

— yters
nguồn

1

Đây có vẻ là một câu hỏi quá rộng đối với tôi. NLP cung cấp một loạt các vấn đề bao gồm mọi thứ từ tầm thường đến không thể giải quyết được. Những lớp cụ thể của nhiệm vụ mà bạn quan tâm? Giấy đó chứa loại "chì" nào?

— Raphael

điều này thực sự khá rộng một cách đáng ngạc nhiên với lịch sử phân tích CS gắn liền với NLP (được định nghĩa một cách lỏng lẻo) thông qua lý thuyết / phân tích cú pháp Chomsky! tức là phân tích cú pháp CFG có thể được cho là gắn liền với lý thuyết NLP sớm. nhưng một định nghĩa cẩn thận / hạn chế / hẹp / chặt chẽ hơn về NLP để hiện đại hơn v.v có thể giúp ích cho nó. Ngoài ra, có rất nhiều phân tích thống kê, xác suất và sự thiếu chính xác trong NLP sao cho các vấn đề quyết định chính xác có thể không phải là một cách quá có ý nghĩa để mô hình hóa sự phức tạp của nó. nó rơi vào học máy nhiều hơn, nơi lý thuyết phức tạp không phải lúc nào cũng có thể áp dụng ...

— vzn

như một hướng khác biệt / mới lạ trong văn học cũng thấy AI hoàn thành

— vzn

2

Sự công nhận của LFG (Ngữ pháp chức năng) là NP-Complete .

Chỉnh sửa theo yêu cầu: Ngữ pháp chức năng từ vựng (LFG) [1] là một lý thuyết về cú pháp ngôn ngữ tự nhiên, được phát triển như là một thay thế cho các lý thuyết về cú pháp chuyển đổi của Chomsky. Một số phiên bản của lý thuyết Chomsky tương đương về mặt tính toán với Ngữ pháp không giới hạn. Ngược lại, LFG cung cấp một chủ nghĩa hình thức ngữ pháp bao gồm một ngữ pháp không ngữ cảnh được tăng cường bởi một hệ thống tính năng.

Đó là hệ thống tính năng hoàn chỉnh NP. Bằng chứng hoạt động về cơ bản bằng cách nhận thấy đầu tiên rằng hệ thống tính năng ít nhất là mạnh mẽ như logic mệnh đề, và thứ hai là ngữ pháp dựa trên việc thỏa mãn tất cả các ràng buộc mệnh đề chi phối câu. Vì vậy, đó là vấn đề thỏa mãn ẩn dưới một chiêu bài khác.

[1] "Ngữ pháp chức năng từ vựng: Một hệ thống chính thức để biểu diễn ngữ pháp" của Ronald M Kaplan và Joan Bresnan. Bài báo ban đầu xuất hiện trong The Mental Đại diện về quan hệ ngữ pháp , ed. Joan Bresnan (Cambridge, MA: Nhà xuất bản MIT, 1982).

— ShyPerson
nguồn

2

Xin hãy giải thích để câu trả lời có thể tự đứng vững. LFG là gì? Làm thế nào để bằng chứng làm việc, đại khái? Có bất kỳ tài liệu tham khảo được công bố?

— Raphael

4

Có lẽ trước tiên người ta nên xác định vấn đề xử lý ngôn ngữ tự nhiên (NLP) là gì.

Ví dụ, ngữ pháp và ngôn ngữ không ngữ cảnh (CF) được giới thiệu bởi các nhà ngôn ngữ học (ngôn ngữ Chomsky loại 2, công việc của Bar-Hillel và các ngôn ngữ khác). Sự mơ hồ là một vấn đề lớn trong Ngôn ngữ học để phân tích câu thực và trong nghiên cứu chính thức về ngữ pháp CF (sự mơ hồ) và ngôn ngữ (sự mơ hồ vốn có). Sự mơ hồ của một ngữ pháp chỉ là bán quyết định.

Vì vậy, tôi đoán vấn đề mơ hồ nên là một câu trả lời cho câu hỏi của bạn. Liệu nó được phân loại là một vấn đề NLP?

Bây giờ nếu bạn thực hiện một số chính thức hóa cú pháp hiện đại, chẳng hạn như xương sống CF với các cấu trúc tính năng (nghĩa là các thuộc tính có cấu trúc), bạn sẽ nhanh chóng có được sức mạnh Turing (cf LFG đã được chứng minh NP cứng , hoặc thậm chí Turing hoàn chỉnh , tùy thuộc vào các biến thể). Vì vậy, nếu bạn không cẩn thận, bạn có tất cả các vấn đề phức tạp mà bạn có thể mơ ước.

Để biết thêm, bạn cũng có thể xem câu hỏi này từ SE-Linguistic: " Liệu phỏng đoán P so với NP trong khoa học máy tính có liên quan trực tiếp đến ngôn ngữ học không? "

Trong câu trả lời của riêng tôi , tôi thực sự chỉ trích ý nghĩa của câu hỏi, hoặc ít nhất là một số cách giải thích của nó. Nhiều vấn đề được xem xét trong ngôn ngữ học, liên quan đến phân tích câu, cho dịch thuật hoặc các mục đích khác, là vấn đề nhỏ, sẽ được giải quyết trong một thời gian rất ngắn. Một số nhà ngôn ngữ học thậm chí có thể tranh luận rằng có sự đệ quy thực sự trong cấu trúc ngôn ngữ, vì bất kỳ đệ quy nào cũng hiếm khi rất sâu sắc. Do đó, người ta có thể tự hỏi về sự phù hợp về mặt ngôn ngữ của phân tích độ phức tạp được xác định là không có triệu chứng. Câu hỏi đầu tiên là liệu chúng ta có đủ gần với tiệm cận để phân tích tiệm cận có ý nghĩa hay không.

Tuy nhiên, nhận xét này không áp dụng cho một số khía cạnh của NLP, khi lượng dữ liệu khổng lồ phải được xử lý. Tôi biết ít nhất hai trường hợp:

khai thác dữ liệu trong khối lớn.
các vấn đề nghịch đảo của ngôn ngữ học: phân tích của corpora lớn để móc trích xuất các dữ liệu đặc trưng một ngôn ngữ, cả về mặt cấu trúc và tạo ra danh sách rộng rãi của các thành phần, chẳng hạn như âm vị, từ vựng cho các bộ phận khác nhau của lời nói (aka preterminals ), tiền tố và hậu tố, hay uốn cơ chế, để đưa ra một vài ví dụ.

Tôi không phải là chuyên gia về khai thác dữ liệu, và do đó không biết liệu nó có thực sự làm tăng các vấn đề phức tạp liên quan đến kích thước của khối được xử lý hay không. Trong trường hợp đó, sự phức tạp tiệm cận thực sự sẽ là một vấn đề. Nhưng nếu nó chủ yếu bao gồm một số lượng lớn các nhiệm vụ phụ gia nhỏ, thì điều đáng nghi ngờ hơn là sự phức tạp tiệm cận có vấn đề lớn. Tuy nhiên, tôi sẽ tưởng tượng rằng một số kỹ thuật khai thác dữ liệu sẽ hoạt động với mối tương quan giữa các tài liệu độc lập và điều đó sẽ làm tăng các vấn đề phức tạp phụ thuộc vào kho dữ liệu.

Trong trường hợp có vấn đề nghịch đảo về ngôn ngữ học, việc xác định ngôn ngữ (mà tôi đoán là có thể được coi là vấn đề khai thác dữ liệu), chúng tôi thực sự đang cố gắng trích xuất thông tin bằng cách tương quan tất cả các phần của khối lớn. Sau đó, phức tạp tiệm cận trở nên cực kỳ liên quan. Rất tiếc, tôi không có vấn đề cụ thể nào trong đầu, có lẽ vì các hệ thống như vậy có mục đích thực dụng và mọi người phát triển chúng sẽ có xu hướng đơn giản là tránh mọi hình thức phức tạp cao hơn, nên phương trình bậc hai có thể đã vượt ra ngoài các tài nguyên có sẵn. Nhưng một tìm kiếm của các tài liệu có thể sẽ đưa ra một số vấn đề phức tạp.

Một điểm khác là ngôn ngữ học không có luật rõ ràng như vật lý. Đây là một vấn đề đủ gần với những gì có thể được coi là đồng thuận ngôn ngữ hiện tại, vì không có hai người nói chính xác cùng một ngôn ngữ. Do đó, xấp xỉ tốt thường là đủ khi mục tiêu rất khó nắm bắt. Các kỹ thuật tôi đã thấy chủ yếu là các kỹ thuật điểm cố định để xác định các tham số bằng cách tính toán lặp lại một số chức năng dựa trên cấu trúc kho văn bản, cho đến khi nó không còn tạo ra nhiều khác biệt (cộng với đầu vào của người dùng để loại bỏ các trường hợp bệnh lý còn lại).

Phân tích tính chất của ngữ pháp và các cấu trúc ngôn ngữ chính thức khác cũng có thể là nguồn gốc của các vấn đề phức tạp cao, như đã đề cập ở trên vì sự mơ hồ, vì các mô tả ngôn ngữ tự nhiên thường đủ lớn để phân tích tiệm cận có ý nghĩa.

— bé yêu
nguồn

1

như trong nhận xét của tôi, đôi khi sự phức tạp của P / NP trong khi khá mạnh có thể là một cái búa làm cho tất cả các câu hỏi phức tạp trông giống như móng tay, và trong lĩnh vực dịch thuật AI & ngôn ngữ với các khía cạnh thống kê, xác suất, thiếu chính xác và học máy, có thể không đôi khi là phép đo lý tưởng và độ phức tạp tính toán lý thuyết không phải lúc nào cũng được coi là đặc biệt trung tâm hoặc có liên quan trong việc học AI / máy ứng dụng nhiều hơn. trong một số cách, toàn bộ lĩnh vực có khía cạnh thực nghiệm hơn để đo lường mức độ phức tạp của vấn đề được áp dụng. tuy nhiên, đây là một góc chưa được chỉ ra trong các câu trả lời khác, có một số cân nhắc về P / NP trong bản dịch ngôn ngữ NLP. ví dụ hai bài báo này

Dịch máy thống kê dựa trên cụm từ như một vấn đề của nhân viên bán hàng du lịch / Zaslavskiy, Dymetman, Cancesda
Độ phức tạp tính toán của dịch máy thống kê / Udupa, Magi

Chúng tôi chứng minh rằng trong khi các Mô hình IBM 1-2 đơn giản về mặt khái niệm và tính toán, thì việc tính toán liên quan đến các mô hình cao hơn (và hữu ích hơn) là khó khăn. Vì không có khả năng tồn tại một giải pháp thời gian đa thức cho bất kỳ vấn đề khó khăn nào (trừ khi $P = NP$ và $P^{\#P} = P$ ), kết quả của chúng tôi nêu bật và chứng minh sự cần thiết của việc phát triển các xấp xỉ thời gian đa thức cho các tính toán này.

— vzn
nguồn