Tôi tự hỏi cơ sở tri thức đóng vai trò gì bây giờ và sẽ đóng trong tương lai?


13

Ngày nay Trí tuệ nhân tạo dường như gần như bằng máy học, đặc biệt là học sâu. Một số người đã nói rằng học sâu sẽ thay thế các chuyên gia của con người, theo truyền thống rất quan trọng đối với kỹ thuật tính năng, trong lĩnh vực này. Người ta nói rằng hai bước đột phá đã củng cố cho sự phát triển của học tập sâu: một mặt, khoa học thần kinh và khoa học thần kinhđặc biệt, cho chúng ta biết rằng giống như bộ não của con người, vốn rất dẻo, mạng nhân tạo có thể được sử dụng để mô hình hóa hầu hết tất cả các chức năng; mặt khác, sự gia tăng sức mạnh tính toán, đặc biệt là sự ra đời của GPU và FPGA, đã thúc đẩy trí thông minh thuật toán một cách tuyệt vời, và đã làm cho các mô hình được tạo ra cách đây vô cùng mạnh mẽ và linh hoạt. Tôi sẽ thêm rằng dữ liệu lớn (chủ yếu là dữ liệu được dán nhãn) được tích lũy trong những năm qua cũng có liên quan.

Những phát triển như vậy đưa tầm nhìn máy tính (và nhận dạng giọng nói) vào một kỷ nguyên mới, nhưng trong các hệ thống xử lý ngôn ngữ tự nhiên và chuyên gia, tình hình dường như không thay đổi nhiều.

Đạt được ý thức chung cho các mạng lưới thần kinh có vẻ là một trật tự cao, nhưng hầu hết các câu, cuộc hội thoại và văn bản ngắn có chứa các suy luận nên được rút ra từ kiến ​​thức thế giới nền. Do đó, biểu đồ tri thức có tầm quan trọng lớn đối với trí tuệ nhân tạo. Mạng lưới thần kinh có thể được khai thác trong việc xây dựng các cơ sở tri thức nhưng dường như các mô hình mạng thần kinh gặp khó khăn trong việc sử dụng các cơ sở tri thức được xây dựng này.

Câu hỏi của tôi là:

  • 1) Cơ sở tri thức (ví dụ: "biểu đồ tri thức" do Google đặt ra) có phải là một nhánh đầy triển vọng trong AI không? Nếu vậy, bằng cách nào KB có thể trao quyền cho máy học? Và làm thế nào nó có thể giúp trong việc tạo ra ngôn ngữ tự nhiên?

  • 2) Để tồn tại trong thời đại bị chi phối bởi DL, đâu là hướng cho cơ sở tri thức (hay cách tiếp cận biểu tượng thuật ngữ ô)? Là kiến thức năng động z giống như Wolfram là hướng đi mới? Hoặc bất kỳ hướng mới?

Hy vọng rằng tôi đang hỏi một câu hỏi thích hợp ở đây, vì tôi không thể gắn thẻ câu hỏi của mình là "cơ sở tri thức" hay "biểu đồ tri thức".

Tôi có thiếu một cái gì đó cơ bản, hoặc một số ý tưởng giải quyết những vấn đề này?


Tôi đã làm việc cho một công ty CNTT lớn đã từng đưa ra thị trường các sản phẩm AI. Vấn đề với cách tiếp cận mạng thần kinh là không có cơ sở tri thức cho mỗi sey. Vì vậy, không có bất kỳ quy tắc nào, mạng lưới thần kinh không thể giải thích "tại sao". Đào tạo một mạng lưới thần kinh, sau đó hình thành các quy tắc trùng lặp mạng sẽ cung cấp cho bạn các câu trả lời như vậy. Nhưng không có bất kỳ hình thức học máy nào có khả năng thực hiện hành vi đó.
MaxW

Vâng. Trong công ty của chúng tôi, bot chitchat chỉ được hỗ trợ bởi NN là rất rất ngu ngốc.
Lerner Zhang

Về mặt khoa học, một khái niệm hoàn toàn đáng ngại!
quintumnia

Tôi tìm thấy bài báo này: arxiv.org/abs/1702.01932
Lerner Zhang

@lerner cảm ơn đã giới thiệu giấy.
Seth Simba

Câu trả lời:


4

Trước hết, tôi muốn chỉ ra những khác biệt chính giữa nền tảng kiến ​​thức và học máy (Sâu), đặc biệt khi trọng tâm chính là "AI" chứ không phải "Khoa học dữ liệu":

  • NN giống như một hộp đen; Ngay cả khi họ tìm hiểu một tập dữ liệu và đạt được sức mạnh khái quát hóa trên miền vấn đề, bạn sẽ không bao giờ biết họ đang làm việc như thế nào. nếu bạn xem xét kỹ các chi tiết của mô hình đã phát triển, tất cả những gì bạn thấy là chữ số, trọng số, kết nối kém và mạnh và các hàm biến đổi. bước "trích xuất tính năng" trước giai đoạn đào tạo thực sự cho bạn biết: "này, con người, đủ với thế giới phức tạp của bạn, hãy bắt đầu số không và những người khác". Trong trường hợp của DL, nó là tồi tệ hơn! chúng tôi thậm chí không nhìn thấy các tính năng được lựa chọn và hiệu quả là gì. Tôi không phải là chuyên gia về DL nhưng theo tôi biết, hộp đen của DL tối hơn! Nhưng cơ sở tri thức được viết bằng một ngôn ngữ thân thiện với con người. sau giai đoạn tích lũy kiến ​​thức, bạn có thể thấy tất cả các kết nối giữa các thực thể và quan trọng hơn, bạn có thể giải thích những kết nối đó. nếu bạn cắt dây trong một cơ sở tri thức, mô hình của bạn sẽ mất chỉ một chút sức mạnh của nó và bạn biết chính xác nó sẽ mất gì; ví dụ ngắt kết nối nút "Sao Diêm Vương" khỏi nút "hệ mặt trời", sẽ cho mô hình của bạn biết deGrasse Tyson đã nói gì với chúng tôi. nhưng trong mô hình ML, điều này có thể biến nó thành một thứ vô dụng thuần túy: điều gì xảy ra nếu bạn thao túng kết nối giữa nơron số 14 và 47 trong mô hình NN được sử dụng để dự đoán hành tinh nào thuộc hệ mặt trời?!

  • Các mô hình ML chỉ đơn thuần là một dòng chữ của dữ liệu. Họ không có sức mạnh suy luận và họ không cho bạn một cái. mặt khác kiến ​​thức có khả năng suy luận từ kiến ​​thức trước như bạn đã chỉ ra trong câu hỏi của bạn. Nó cho thấy rằng các mô hình DL đã được đào tạo với dữ liệu phân loại hình ảnh cũng có thể được áp dụng cho vấn đề phát hiện giọng nói. Nhưng điều này không có nghĩa là các mô hình DL có thể áp dụng kiến ​​thức trước đó của nó trong miền hình ảnh vào miền giọng nói.

  • Bạn cần hàng kg dữ liệu cho các thuật toán ML truyền thống và hàng tấn dữ liệu cho các thuật toán DL. nhưng một ví dụ duy nhất của bộ dữ liệu sẽ tạo ra một nền tảng kiến ​​thức có ý nghĩa cho bạn.

Có hai chủ đề nghiên cứu chính trong NLP: dịch máy và trả lời câu hỏi. Trên thực tế, người ta đã chứng minh rằng DL hoạt động đáng kể với các vấn đề dịch máy nhưng lại tỏ ra ngu ngốc khi trả lời câu hỏi, đặc biệt khi miền của các chủ đề được đề cập trong cuộc trò chuyện giữa người và máy. Cơ sở tri thức không phải là lựa chọn tốt cho dịch máy nhưng có lẽ là chìa khóa cho một máy trả lời câu hỏi cao quý. Vì những gì quan trọng trong dịch máy chỉ là phiên bản dịch của văn bản (và tôi không quan tâm làm thế nào mà máy thực hiện được điều đó đúng như vậy) nhưng trong vấn đề trả lời câu hỏi, tôi không cần một con vẹt lặp lại cùng một thông tin tôi đã đưa cho anh ta, nhưng một sinh vật thông minh cho tôi "táo có thể ăn được" sau khi tôi nói với anh ta "táo là một loại trái cây" và "


Tất cả các loại trái cây đều có thể ăn được, miễn là chúng không ẩn dụ, chẳng hạn như trái cây "lao động của một người". (Sau đó, một lần nữa, chúng ta có thể sử dụng "nuốt chửng" theo nghĩa bóng, chẳng hạn như khi người ta nuốt một câu trả lời ngăn xếp "ngon" và tiêu hóa nội dung của nó;)
DukeZhou
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.