Có thể đào tạo mạng lưới thần kinh để giải các phương trình toán học?


24

Tôi biết rằng các mạng thần kinh có thể không được thiết kế để làm điều đó, tuy nhiên, theo giả thuyết, liệu có thể đào tạo mạng lưới thần kinh sâu (hoặc tương tự) để giải các phương trình toán học?

Vì vậy, đưa ra 3 đầu vào: số thứ nhất, ký hiệu toán tử được biểu thị bằng số (1 - +, 2 - -, 3 - /, 4 - *, v.v.) và số thứ 2, sau khi đào tạo mạng sẽ cho tôi kết quả hợp lệ.

Ví dụ 1 ( 2+2):

  • Đầu vào 1 : 2; Đầu vào 2: 1( +); Đầu vào 3 : 2; Sản lượng dự kiến:4
  • Đầu vào 1 : 10; Đầu vào 2: 2( -); Đầu vào 3 : 10; Sản lượng dự kiến:0
  • Đầu vào 1 : 5; Đầu vào 2: 4( *); Đầu vào 3 : 5; Sản lượng dự kiến:25
  • và như vậy

Ở trên có thể được mở rộng cho các ví dụ tinh vi hơn.

Điều đó có thể không? Nếu vậy, loại mạng nào có thể học / đạt được điều đó?



1
Điều này có thể có liên quan - github.com/deepmind/mathatures_dataset
GaneshTata

Câu trả lời:


21

Vâng, nó đã được thực hiện!

Tuy nhiên, các ứng dụng không thay thế máy tính hoặc bất cứ thứ gì tương tự. Phòng thí nghiệm tôi liên kết với việc phát triển các mô hình mạng lưới thần kinh của lý luận phương trình để hiểu rõ hơn về cách con người có thể giải quyết những vấn đề này. Đây là một phần của lĩnh vực được gọi là nhận thức toán học . Thật không may, trang web của chúng tôi không có nhiều thông tin, nhưng đây là một liên kết đến một ví dụ về công việc như vậy.

Ngoài ra, công việc gần đây về việc mở rộng mạng lưới thần kinh để bao gồm các cửa hàng bộ nhớ ngoài (ví dụ Máy thần kinh) có xu hướng sử dụng giải các bài toán như một bằng chứng tốt về khái niệm. Điều này là do nhiều vấn đề số học liên quan đến các thủ tục dài với kết quả trung gian được lưu trữ. Xem các phần của bài viết này về phép cộng và nhân nhị phân dài.


đối với tôi không chỉ là mạng lưới thần kinh mà là kiến ​​trúc thần kinh với bộ nhớ ngoài. Các kiến ​​trúc như NTM và DNC có thể sử dụng để giải các thuật toán như con đường ngắn nhất vì chúng có khả năng thực hiện quy trình lặp bằng cách theo dõi những gì đã được thực hiện (Không quên lãng thảm khốc). Nhưng đối với tôi, việc sử dụng chỉ học tập có mục đích đơn giản là sai như đã đề cập trong câu trả lời thứ hai.
Shamane Siriwardhana

Liên kết đầu tiên đã chết, bạn có thay thế không?
kenorb

Cả hai liên kết chỉ làm việc cho tôi, thật là một bài báo tuyệt vời!
Zakk Diaz

8

Không hẳn vậy.

Mạng nơ-ron rất tốt để xác định mối quan hệ phi tuyến tính giữa các đầu vào khi có các biến ẩn. Trong các ví dụ trên, các mối quan hệ là tuyến tính và không có biến ẩn. Nhưng ngay cả khi chúng không tuyến tính, một thiết kế ANN truyền thống sẽ không phù hợp để thực hiện điều này.

Bằng cách xây dựng cẩn thận các lớp và giám sát chặt chẽ việc đào tạo, bạn có thể có được một mạng liên tục tạo ra đầu ra 4.01, giả sử, cho các đầu vào: 2, 1 (+) và 2, nhưng điều này không chỉ sai, nó vốn không đáng tin cậy ứng dụng công nghệ.


5

1) Có thể! Trên thực tế, đó là một ví dụ về khung học tập sâu phổ biến Keras. Kiểm tra liên kết này để xem mã nguồn .

2) Ví dụ cụ thể này sử dụng mạng thần kinh tái phát (RNN) để xử lý vấn đề dưới dạng một chuỗi các ký tự, tạo ra một chuỗi các ký tự tạo thành câu trả lời. Lưu ý rằng phương pháp này rõ ràng khác với cách con người có xu hướng nghĩ về việc giải quyết các vấn đề bổ sung đơn giản và có lẽ không phải là cách bạn muốn máy tính giải quyết vấn đề như vậy. Chủ yếu đây là một ví dụ về trình tự học theo trình tự sử dụng Keras. Khi xử lý các đầu vào tuần tự hoặc chuỗi thời gian, RNN là một lựa chọn phổ biến.


1

Có - dường như bây giờ có thể đạt được nhiều hơn được yêu cầu từ ví dụ bạn đã đưa ra bài viết này mô tả một giải pháp DL cho một vấn đề khó khăn hơn đáng kể - tạo mã nguồn cho một chương trình được mô tả bằng ngôn ngữ tự nhiên .

Cả hai điều này có thể được mô tả là các vấn đề hồi quy (nghĩa là mục tiêu là để giảm thiểu một số chức năng mất trên bộ xác thực), nhưng không gian tìm kiếm trong trường hợp ngôn ngữ tự nhiên lớn hơn nhiều.


Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.