Có ai còn sử dụng Lý thuyết phụ thuộc khái niệm không?


11

Roger Schank đã thực hiện một số công việc thú vị về xử lý ngôn ngữ với Khái niệm phụ thuộc (CD) vào những năm 1970. Sau đó, anh ấy đã di chuyển ra khỏi lĩnh vực này, trong Giáo dục những ngày này. Có một số ứng dụng hữu ích trong việc tạo ngôn ngữ tự nhiên (BABEL), tạo câu chuyện (TAILSPIN) và các lĩnh vực khác, thường liên quan đến lập kế hoạch và các tập hơn là các câu riêng lẻ.

Có ai khác tiếp tục sử dụng CD hoặc các biến thể của chúng? Tôi không biết về bất kỳ dự án nào khác, ngoài Hovy's PAULINE sử dụng CD làm đại diện cho câu chuyện để tạo ra.

Câu trả lời:


1

Có ai còn sử dụng Lý thuyết phụ thuộc khái niệm không?

Đúng. Nhiều người. Các phụ thuộc về khái niệm là trung tâm của việc truyền đạt ý tưởng bằng ngôn ngữ tự nhiên.

Đây chỉ là một vài ấn phẩm trong thế kỷ này dựa trên công việc của Schank hoặc đi song song với hướng đi của ông trong các lĩnh vực liên quan.

Tôi đã gặp Roger Schank ở Hartford, vào năm 1992, trong một chuỗi bài giảng được tài trợ bởi các phòng thí nghiệm AI của Trung tâm nghiên cứu United Technologies và một vài công ty Fortune 500 khác trong khu vực. Toàn bộ bài giảng của ông là một chuỗi các câu chuyện trong nghiên cứu AI. Tôi nhớ mọi câu chuyện 26 năm sau.

Các triển khai NLP đồ chơi mà bạn thấy trong lĩnh vực này ngày nay nhạt so với các hệ thống lý luận và bộ nhớ dựa trên câu chuyện do Tiến sĩ Schank đề xuất như một lời giải thích có thể có về các quan sát có thể được thực hiện về giao tiếp bằng giọng nói của con người.

Thật dễ dàng để đoán lý do anh chuyển sang giáo dục. Ngôn ngữ tự nhiên và ý tưởng trí tuệ nhân tạo của anh ấy có khoảng một thế kỷ đầu và trên đầu của hầu hết những người có mặt tại giảng đường cùng với tôi.

Nếu bạn và tôi thấy những đề xuất lý luận và trí nhớ dựa trên câu chuyện của anh ấy hấp dẫn, có lẽ chúng ta là một thế kỷ quá sớm và hơi vượt trội so với những người đứng đầu trong lĩnh vực NLP ngày nay. Hầu hết những người trong phòng thí nghiệm vào những năm 1980 đều thấy Schank cáu kỉnh, và những người phù hợp với văn hóa công nghệ ngày nay thấy anh ta không liên quan.

Một số trong những người tôi đã tương tác với một dự án từ Đại học Michigan ở Ann Arbor không thấy công việc của anh ấy không liên quan, và công việc của họ là theo hướng anh ấy chỉ ra. Thật không may, NDA khách hàng hạn chế tôi bình luận thêm về dự án đó.

Lý do chúng ta không nên và cuối cùng sẽ không từ bỏ ý tưởng mà chúng ta truyền đạt trong các câu chuyện là vì nó đúng. Khi một người nói: "Nó khiến tôi muốn nôn nao" hoặc "Tôi cũng yêu bạn", việc phân tích trực tiếp những câu đó bằng cách sử dụng các kỹ thuật "hiện đại" không liên quan chặt chẽ đến việc tái cấu trúc ý tưởng trong tâm trí của loa. Cả hai câu đều tham chiếu một đống khái niệm về sự phụ thuộc lẫn nhau mà chúng ta gọi là một câu chuyện.

Nếu hai "cô gái tiệc tùng" đang ở trong phòng dành cho phụ nữ tại buổi hòa nhạc của Borgore và một người nói: "Đưa tôi một cuộn", thì việc giải thích từ "cuộn", phụ thuộc vào khái niệm. Nếu người nói đang ở trong một gian hàng, điều đó có nghĩa là một điều. Nếu tại bồn rửa có nghĩa là khác.

Sẽ luôn có một số phân khúc của cộng đồng nghiên cứu hiểu điều này. Những người không thể xây dựng các máy tự động tiết kiệm tiền sẽ trả lời các cuộc gọi điện thoại của doanh nghiệp bạn, nhưng họ sẽ không đề cập đến bạn về mô hình quan hệ khách hàng chỉ ra vấn đề chính sách.

Các đại lý NLP đồ chơi này, cho đến khi họ phát triển các khả năng mà Tiến sĩ Schank đề xuất, sẽ không nhận ra từ các cuộc trò chuyện qua điện thoại với khách hàng rằng việc cải tiến sản phẩm hoặc dịch vụ là một cơ hội đang chờ khai thác và họ sẽ không kể cho bạn một câu chuyện sẽ thuyết phục bạn rằng bạn sẽ được hưởng lợi từ việc là người đầu tiên tận dụng cơ hội.


1

Mặc dù mô hình này đóng một vai trò quan trọng trong việc đóng góp cho sự hiểu biết hiện tại của chúng tôi về NLP và NLU, nhưng nó không còn hữu ích trong các hệ thống sản xuất và hiện tại không có sản phẩm thương mại thành công nào theo phương pháp này.

Trong CDT, mục tiêu là thiết kế một hệ thống AI có thể rút ra những suy luận logic từ các câu. Trong hệ thống này, mục tiêu là làm cho ý nghĩa độc lập với các từ được sử dụng trong đầu vào.

CDT đã mô hình hóa các câu bằng cách sử dụng các mã thông báo như: địa điểm, thời gian, hành động trong thế giới thực và các đối tượng trong thế giới thực. Tuy nhiên, khi sức mạnh tính toán trở nên phổ biến hơn và ít tốn kém hơn, sự quan tâm chuyển hướng sang các mô hình thống kê hiện đang vượt trội so với các hệ thống dựa trên quy tắc trước đây.

Vấn đề với các cách tiếp cận dựa trên quy tắc như CDT là chúng yêu cầu phát triển thủ công các quy tắc ngôn ngữ có thể tốn kém và thường không khái quát tốt cho các ngôn ngữ khác.

Mặt khác, các phương pháp thống kê sử dụng tài nguyên ngôn ngữ của con người (văn bản đa ngôn ngữ) hiệu quả hơn. Thay vì sử dụng cách tiếp cận dựa trên quy tắc, các mô hình thống kê đưa ra các quyết định xác suất mềm dựa trên việc gắn trọng số thực vào các tính năng tạo nên dữ liệu đầu vào. (Wikipedia NLP)

Việc sử dụng hiệu quả tài nguyên ngôn ngữ của con người này dẫn đến một mô hình chính xác và mạnh mẽ hơn, đặc biệt là khi được đưa vào đầu vào không quen thuộc hoặc đầu vào có lỗi. Các mô hình thống kê cũng khái quát tốt cho các ngôn ngữ khác.


Cảm ơn vì đã trả lời; Tôi biết các mô hình thống kê và các thuộc tính của chúng, nhưng đối với câu hỏi này tôi chỉ quan tâm đến CDT!
Oliver Mason

Chủ đề là một niềm vui để nghiên cứu và trả lời. Tôi đã giới thiệu các mô hình thống kê ở cuối để so sánh, tuy nhiên tôi hoàn toàn hiểu ý của bạn.
Seth Simba
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.