Ở mức độ nào thì toán học nâng cao của Viking là cần thiết / hữu ích trong nghiên cứu AI?


18

Tôi hiện đang học toán. Tuy nhiên, tôi không nghĩ rằng tôi muốn trở thành một nhà toán học chuyên nghiệp trong tương lai. Tôi đang nghĩ đến việc áp dụng kiến ​​thức toán học của mình để thực hiện nghiên cứu về trí tuệ nhân tạo. Tuy nhiên, tôi không chắc có bao nhiêu khóa học toán tôi nên theo. (Và những khóa học lý thuyết CS nào tôi nên theo.)

Từ Quora, tôi đã học được rằng các môn học Đại số tuyến tính, Thống kê và Tối ưu hóa lồi có liên quan nhất đến Machine Learning (xem câu hỏi này ). Một số người khác đề cập rằng học Đại số tuyến tính, Xác suất / Thống kê, Tính toán, Thuật toán cơ bản và Logic là cần thiết để nghiên cứu trí tuệ nhân tạo (xem câu hỏi này ).

Tôi có thể tìm hiểu về tất cả các môn học này trong 1,5 năm đầu tiên của tôi về Cử nhân toán học tại trường đại học của chúng tôi.

Tuy nhiên, tôi đã tự hỏi, nếu có một số đại học các môn toán cấp độ sau đại học hữu ích hoặc thậm chí cần thiết để nghiên cứu trí tuệ nhân tạo. Thế còn ODE, PDE, Topology, Lý thuyết đo lường, Phân tích tuyến tính, Phân tích và phân tích Fourier trên Manifold?

Một cuốn sách gợi ý rằng một số toán học khá tiên tiến rất hữu ích trong việc nghiên cứu trí tuệ nhân tạo là Lý thuyết mẫu: Phân tích Stochastic tín hiệu Real-Thế giới David Mumford và Agnes Desolneux (xem này trang). Nó bao gồm các chương về Chuỗi Markov, Mô hình Gaussian Piecewise, Trường Gibbs, Manifold, Nhóm Lie và Lie Algebras và các ứng dụng của chúng cho lý thuyết mẫu. Cuốn sách này hữu ích trong nghiên cứu AI?


22
trong hơn 2 năm trên trang web này, tôi đã thấy hơn nửa tá câu hỏi thuộc loại "tôi cần toán học gì cho ...". Que trả lời mà đọc giống như nội dung của Princeton Companion to Math. 1) AI là một lĩnh vực khổng lồ, toán học được sử dụng trong các trường con của nó có tất cả các hương vị; 2) Tham gia các khóa học toán cơ bản của bạn, chọn các khóa học nâng cao hơn dựa trên sở thích; 3) Thực hiện nghiên cứu về AI, tìm những gì bạn thích, tìm những gì toán học được sử dụng ở đó; 4) Chúng ta không thể biết apriori toán học nào sẽ hữu ích cho vấn đề này hay vấn đề đó.
Sasho Nikolov

Câu trả lời:


55

Tôi không muốn nghe có vẻ hạ thấp, nhưng môn toán bạn đang học ở bậc đại học và thậm chí các khóa học sau đại học không được nâng cao. Đây là những điều cơ bản . Tiêu đề của câu hỏi của bạn nên là: Toán học "cơ bản" có cần thiết / hữu ích trong nghiên cứu AI không? Vì vậy, hãy ngấu nghiến hết mức có thể, tôi chưa bao giờ gặp một nhà khoa học máy tính nào phàn nàn về việc biết quá nhiều toán học, mặc dù tôi đã gặp nhiều người phàn nàn về việc không biết đủ về nó. Tôi nhớ đã giúp một sinh viên tốt nghiệp về AI hiểu thuật toán theo kiểu xếp hạng trang. Nó chỉ là một số đại số tuyến tính khá dễ dàng đối với tôi, nhưng anh ta đau khổ vì anh ta không có cảm giác gì về giá trị bản địa và người bản địa. Hãy tưởng tượng những điều AI người ta có thể làm nếu họ thực sự biết nhiều toán học!

Tôi giảng dạy tại một khoa toán và tôi thường xuyên nhận được yêu cầu từ các đồng nghiệp CS của mình để giới thiệu các chuyên ngành toán cho Tiến sĩ CS vì họ thích sinh viên toán hơn. Bạn thấy đấy, toán học thực sự, thực sự rất khó để tự học, nhưng hầu hết các khía cạnh của khoa học máy tính thì không. Tôi biết, tôi là một chuyên gia toán học đã vào trường cao học CS. Chắc chắn, tôi đã "đứng sau" về kiến ​​thức hệ điều hành (mặc dù có kiến ​​thức tốt về Unix và VMS), nhưng tôi đã đi trước "lý thuyết". Đó không phải là một tình huống đối xứng.


6
lý thuyết đo lường và lý thuyết xác suất là cơ sở cho tất cả các lý luận xác suất. cấu trúc liên kết đã trở nên rất quan trọng để phân tích dữ liệu tô pô. Phân tích Fourier rất quan trọng đối với việc học lý thuyết (nó được sử dụng để hiểu độ nhạy của các chức năng và mức độ khó của việc học chúng), và việc học đa dạng đòi hỏi sự hiểu biết sâu sắc về hình học đa tạp.
Suresh Venkat

2
@MaxMuller: Và để tiếp tục danh sách, lý thuyết nhóm và đại số (như đại số Lie) được sử dụng rộng rãi trong nhận dạng mẫu trong lý thuyết phân rã hình ảnh trong đó cấu trúc liên kết được yêu cầu nhiều (và có một mối liên hệ sâu sắc giữa đại số Lie và đa tạp bạn cần học dọc đường). Những cuốn sách như "Nguyên tắc cơ bản của nhận dạng mẫu" của Monique Pavel thậm chí sẽ giới thiệu cho bạn về lý thuyết thể loại và ứng dụng của nó, điều này cũng cực kỳ quan trọng trong AI vì nó được sử dụng trong nền tảng của ngôn ngữ chính thức và lý thuyết bằng chứng (có thể là lý thuyết về lý luận) ...
ex0du5

1
Qua các khóa học grad mức giới thiệu, các nhà toán học tìm hiểu tất cả toán học của họ một mình (hoặc đọc các nhóm và các buổi hội thảo) .. nó không phải là tất cả khó nếu bạn có một số cơ sở ... ok, nó có thể là khó khăn, nhưng nó không phải là bất khả thi.
Sasho Nikolov

1
Max, tôi cũng dạy aikido. Tôi không nhớ bất kỳ học sinh nào của aikido hỏi "tại sao tôi phải học những điều cơ bản (làm thế nào để ngã, làm thế nào để di chuyển khỏi đường tấn công)?" Đôi khi bạn cần tin tưởng một chút rằng giáo viên của bạn biết họ đang làm gì. Tuy nhiên, tôi sẽ là người đầu tiên thừa nhận rằng chúng tôi dạy rất nhiều chuyện tào lao, đặc biệt là ở các trường trung học và tiểu học nơi toán học được dạy như thể mục đích là để kiềm chế sự tò mò ở học sinh. Nhưng trong trường hợp của bạn, các đối tượng bạn liệt kê, chúng không phải là tào lao. Tin tôi đi
Andrej Bauer

13
Và chỉ một bình luận nữa. Nếu bạn chỉ học toán đã được chứng minh là hữu ích trong một số lĩnh vực của CS, bạn sẽ không bao giờ có cơ hội áp dụng toán mới. Bạn sẽ luôn ở phía sau. Khoa học là một nghệ thuật, không phải là một công việc 9-5. Nếu bạn hỏi tôi "tôi có nên học vật lý không, tôi muốn vào AI" tôi sẽ nói "hoàn toàn như vậy!" Và nếu bạn hỏi "tôi có nên học xã hội học không, tôi muốn vào AI" thì câu trả lời của tôi vẫn sẽ như vậy.
Andrej Bauer

6

Tối đa, đây là danh sách một phần (nhất thiết):

Đại số tuyến tính cơ bản và xác suất là cần thiết ở khắp mọi nơi. Tôi cho rằng bạn không cần tài liệu tham khảo cho điều đó.

Theo hiểu biết của tôi, phân tích Fourier đã được sử dụng trong một số nghiên cứu liên quan đến lý thuyết học tập. Thủ tục thanh toán giấy này , ví dụ.

Khái niệm học tập đa dạng đang trở nên phổ biến, và bạn có thể bắt đầu xem qua các tác phẩm của Mikhail belkin và Partha Niyogi. Dòng công việc này đòi hỏi sự hiểu biết về các khái niệm khác nhau liên quan đến đa tạp và hình học riemannian.

Có một khía cạnh khác của học máy, có nguồn gốc sâu xa hơn về thống kê, viz., Hình học thông tin. Khu vực này liên quan đến các khái niệm khác nhau về hình học Riemannian, lý thuyết thông tin, thông tin Fisher, v.v ... Một người anh em họ của loại nghiên cứu này có thể được tìm thấy trong thống kê Đại số - một lĩnh vực còn non trẻ với rất nhiều tiềm năng.

Sumio Watanabe, đã điều tra một biên giới khác, viz., Sự tồn tại của điểm kỳ dị trong các mô hình học tập và cách áp dụng kết quả sâu sắc của độ phân giải từ hình học đại số để giải quyết nhiều câu hỏi. Kết quả của Watanabe dựa trên rất nhiều từ tác phẩm nổi tiếng của Heisuke Hironaka đã giành được huy chương Trường.

Tôi cho rằng tôi đang bỏ qua nhiều lĩnh vực khác đòi hỏi toán học tương đối nặng. Nhưng như Andrej đã chỉ ra, hầu hết trong số họ có thể không nằm ở biên giới của toán học, mà là những lĩnh vực tương đối cũ và đã được thiết lập.

Tuy nhiên, ở mức độ nào, tôi cho rằng trạng thái hiện tại của AI đã tham gia vào điện toán chính thống - chẳng hạn như trong các hệ thống khuyến nghị ở Amazon hoặc các thư viện máy học được tìm thấy trong Apache Mahout, không yêu cầu bất kỳ toán học nâng cao nào. Tôi có thể sai.


2

Phụ thuộc vào định nghĩa của bạn về nâng cao và loại AI bạn muốn nghiên cứu.

Nhiều vấn đề trong AI có thể chứng minh được - các giải pháp tối ưu cho POMDP là NP-Complete, các giải pháp tối ưu cho DEC-POMDP có thể chứng minh là NEXP-Complete, v.v. Vì vậy, không có một đột phá bất ngờ nào trong lý thuyết phức tạp, người ta càng biết nhiều hơn về thuật toán xấp xỉ và nền tảng lý thuyết của họ, tốt hơn. (Ngoài lý thuyết đo lường, v.v., cần phải thực sự hiểu xác suất Bayes làm cơ sở cho mô hình POMDP.)

Trí thông minh nhân tạo đa tác nhân, đặc biệt, giao thoa với lý thuyết trò chơi; Vì vậy, biết lý thuyết trò chơi là hữu ích, đến lượt nó phụ thuộc vào cấu trúc liên kết, lý thuyết đo lường, v.v. Và tương tự, nhiều vấn đề trong lý thuyết trò chơi là khó hiểu. Một số thậm chí không thể tìm thấy dưới sự gần đúng và thậm chí hiểu khi có thể tính gần đúng một cách hữu ích cần một lượng toán học đáng kể để giải quyết.

(Tôi lưu ý rằng các nhà lý thuyết trò chơi đã hoạt động khá tốt trong lĩnh vực Kinh tế Nobel, trong vài năm qua, và đó là tính toán học nặng nề. Tôi dự đoán trong hai mươi năm tới, các nhà lý thuyết trò chơi thuật toán ngày nay sẽ giống nhau Chức vụ.)


1

Các toán học liên quan đến AI không tiên tiến, và được dạy ở cấp độ đại học. Các thuật toán đào tạo và suy luận AI thuộc lĩnh vực Khoa học Máy tính tiên tiến.

Nó là một chút của một trò chơi chữ. Một số lịch sử cũng nên được đưa vào khi nghiên cứu AI.

Ví dụ, trong danh pháp hiện tại, Deep Learning dường như là một từ khóa xu hướng trong AI.

Deep Learning là những gì từng được gọi là Mạng nơ ron nhân tạo (ANN), chẳng hạn như mô hình mạng perceptron truyền bá ngược của Hinton (BACKPROP), và tương tự.

Các toán học liên quan đến BACKPROP ANN (ví dụ) về cơ bản là phép tính đạo hàm cho đào tạo và đại số ma trận cho suy luận.

Khía cạnh mới của Deep Learning là sự tách biệt vật lý giữa các thuật toán đào tạo và suy luận. CPU vẫn được sử dụng để đào tạo, nhưng bây giờ GPU được sử dụng để suy luận.

Ví dụ, ma trận ANN được đào tạo (có trọng số) bằng cách sao lưu các lỗi sử dụng phép tính đạo hàm hiệu chỉnh. Điều này phù hợp nhất với CPU và chỉ phải được thực hiện một lần cho mỗi lần triển khai ANN.

ANN sau đó được triển khai theo kiến ​​trúc GPU song song cao. Toán học suy luận về phía trước liên quan đến đại số ma trận chuyên sâu, mà GPU được thiết kế cho.

Điều này giúp tăng hiệu suất của ANN được triển khai lên vài bậc so với các triển khai dựa trên CPU trước đây và có thể được thu nhỏ hiệu quả hơn trên bất kỳ số lượng GPU chuyên dụng nào.

Các công ty như Nvidia và AMD hiện đang tiếp thị các chipset GPU rất cao cấp như Deep Learning Machines. Thuật ngữ GPU luôn là một từ sai, vì chúng thực sự là mục đích chung của Bộ xử lý song song. Ví dụ, GPU đôi khi cũng được gọi là Bitminers trong các ứng dụng blockchain.

Vì vậy, những gì đã cũ là bây giờ mới. Các toán học liên quan đã không thay đổi, chỉ là thuật ngữ của Khoa học Máy tính (chủ yếu là do áp lực tiếp thị).

Thuật ngữ AI luôn được coi là một con ngựa đen. Deep Learning hiện là thuật ngữ chính xác, thân thiện với thị trường.


2
Một câu trả lời trước đó đã đưa ra phản hồi cho yêu cầu của bạn trong câu đầu tiên. (Có nhiều người khác nữa.) Bạn đã đọc câu trả lời trước khi đăng chưa? Bạn có thể muốn chỉnh sửa câu trả lời này để thu hẹp yêu cầu của mình.
DW

2
Yêu cầu của bạn rằng "CPU vẫn được sử dụng để đào tạo [mạng sâu], nhưng hiện tại GPU được sử dụng để suy luận" là khá sai lệch (nếu không nói là không chính xác). Tất cả mọi người đào tạo mạng lưới thần kinh hiện đại là trên GPU. Hầu hết mọi người cũng triển khai chúng trên GPU, nhưng một số môi trường triển khai (ví dụ như một số điện thoại di động) vẫn sử dụng CPU.
Mike Izbicki

Tôi đồng ý với Mike. "GPU được sử dụng để đào tạo và CPU để suy luận" ít chính xác hơn so với việc nói rằng "CPU được sử dụng để đào tạo và GPU để suy luận"
ASDF

Các kiến ​​trúc đường ống @MikeIzbicki như CUDA, OpenCL, v.v ... được yêu cầu để đào tạo về Deep Learning, vốn phụ thuộc rất nhiều vào lõi CPU để sửa lỗi. Đường ống suy luận chỉ yêu cầu lõi CPU để cung cấp và thu hoạch lõi GPU. Hiệu suất năng lượng và nhiệt là mục tiêu, đó là lý do tại sao sự cân bằng giữa các loại cốt lõi thay đổi giữa đào tạo và suy luận. Đó là những gì tôi đã nói.
Birkensocks

-1

AI là một lĩnh vực rộng lớn đáng kinh ngạc với một loạt các tuyến đường có thể. Một số cực kỳ toán học, một số hầu như không chạm vào toán học. Những người khác đã đưa ra câu trả lời tốt cho các phương pháp toán học hơn. Trong số các môn bạn đã chỉ ra-

"Đại số tuyến tính, Xác suất / Thống kê, Tính toán, Thuật toán cơ bản và Logic"

- về cơ bản bạn cần hoặc sẽ được hưởng lợi từ tất cả chúng. Nhiều cách tiếp cận ít nhất một phần trực tiếp dựa trên xác suất và thống kê - heuristic, mạng lưới thần kinh, thuật toán di truyền, logic mờ. Giải tích cũng hữu ích không kém - trong AI hoặc trong khoa học điện toán nói chung, bạn sẽ tìm thấy nó ở hầu hết mọi nơi. Đại số tuyến tính là một cái gì đó bạn chắc chắn cần là tốt.

Hai môn học quan trọng nhất theo quan điểm CS / AI là thuật toán và logic, thuật toán là trái tim thực sự của khoa học máy tính và logic là 'ngôn ngữ' cơ bản của thuật toán .. Chìa khóa để học thuật toán là học cách lập trình, thành thạo và thực hành tại lập trình cơ bản là một trong những nền tảng quan trọng nhất của hầu hết các môn khoa học máy tính hoặc AI. Lập trình cũng là một kỹ năng mà các trường đại học không phải lúc nào cũng đặc biệt giỏi trong giảng dạy. Logic cũng thực sự cần thiết cho hầu hết các nhánh của AI; Logic Boolean, tính toán vị ngữ, logic biểu tượng, các lý thuyết cơ bản về hoán vị, hệ thống phân cấp của thiết kế, đệ quy, máy trạng thái hữu hạn, Turing Machines, thiết kế CPU, v.v.

Mở rộng sang lĩnh vực toán học 'AI mạnh mẽ' của riêng tôi đóng một vai trò cơ bản nhưng cực kỳ cần thiết. Một sự hiểu biết rất tốt về toán học cơ bản có lẽ quan trọng hơn toán học cao hơn, nhưng thực sự bất cứ điều gì bạn nhặt được đều có thể hữu ích. Vấn đề thực sự trong một lĩnh vực non trẻ như Strong AI là mọi thứ đều ở trên không và do đó, lĩnh vực này hoàn toàn thay đổi.
Các môn học có khả năng hữu ích bao gồm - mạng lưới thần kinh, thuật toán di truyền, thần kinh học, di truyền học, tâm lý học, điều khiển học và robot, lý thuyết đồ họa 3D, lý thuyết xử lý hình ảnh, thiết kế trò chơi máy tính, triết học, lý thuyết nghệ thuật, điện tử kỹ thuật số, lý thuyết ngôn ngữ .. giống như cách đọc này là một trong những cách quan trọng nhất để học. Một vài cuốn sách khởi đầu cho tôi là - The Emperors New Mind của Roger Penrose, Eye and Brain của RL Gregory, nhưng những hiểu biết thực sự có thể đến từ hầu hết mọi nơi

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.