Tiến sĩ của tôi là trong toán học thuần túy, và tôi thừa nhận tôi không biết nhiều (tức là bất cứ điều gì) về CS lý thuyết. Tuy nhiên, tôi đã bắt đầu khám phá các lựa chọn phi học thuật cho sự nghiệp của mình và giới thiệu bản thân với học máy, tình cờ tìm thấy những câu như "Không ai hiểu tại sao mạng lưới thần kinh hoạt động tốt", điều mà tôi thấy thú vị.
Câu hỏi của tôi, về cơ bản, là những loại câu trả lời mà các nhà nghiên cứu muốn? Đây là những gì tôi đã tìm thấy trong tìm kiếm ngắn gọn của tôi về chủ đề:
- Các thuật toán thực hiện các mạng thần kinh đơn giản là khá đơn giản.
- Quá trình của SGD được hiểu rõ về mặt toán học, cũng như lý thuyết thống kê.
- Định lý gần đúng phổ quát là mạnh mẽ và đã được chứng minh.
- Có một bài báo hay gần đây https://arxiv.org/abs/1608.08225 về cơ bản đưa ra câu trả lời rằng phép tính gần đúng phổ quát hơn nhiều so với thực tế chúng ta cần vì chúng ta có thể đưa ra các giả định đơn giản hóa mạnh mẽ về các chức năng mà chúng ta đang cố gắng mô hình hóa với mạng lưới thần kinh.
Trong bài báo đã nói ở trên, họ tuyên bố (diễn giải) "Các thuật toán GOFAI được hiểu đầy đủ về mặt phân tích, nhưng nhiều thuật toán ANN chỉ được hiểu theo cách hiểu". Các định lý hội tụ cho các thuật toán được triển khai là một ví dụ về sự hiểu biết phân tích rằng dường như chúng ta có về các mạng thần kinh, vì vậy một tuyên bố ở cấp độ tổng quát này không cho tôi biết nhiều về những gì được biết so với chưa biết hoặc những gì sẽ được coi là "một câu trả lời . "
Các tác giả đề nghị trong kết luận rằng các câu hỏi như giới hạn hiệu quả về kích thước của mạng lưới thần kinh cần thiết để xấp xỉ một đa thức đã cho là mở và thú vị. Các ví dụ khác về các câu hỏi phân tích cụ thể về mặt toán học cần được trả lời để nói rằng chúng ta "hiểu" các mạng lưới thần kinh là gì? Có câu hỏi nào có thể được trả lời bằng ngôn ngữ toán học thuần túy hơn không?
(Tôi đặc biệt nghĩ về các phương pháp trong lý thuyết biểu diễn do sử dụng vật lý trong bài báo này --- và, ích kỷ, bởi vì đó là lĩnh vực nghiên cứu của tôi. Tuy nhiên, tôi cũng có thể tưởng tượng các lĩnh vực như lý thuyết tổ hợp / đồ thị, hình học đại số và cấu trúc liên kết cung cấp các công cụ khả thi.)