Cơ sở toán học để khai thác dữ liệu và thuật toán trí tuệ nhân tạo


12

Bạn có thể cho tôi một số làm rõ về khai thác dữ liệu và thuật toán trí tuệ nhân tạo? Những cơ sở toán học họ đã sử dụng cho? Bạn có thể cho tôi điểm bắt đầu, trong toán học, để hiểu các loại thuật toán này?


Để đưa ra một ví dụ, David Ferrucci, người đã lãnh đạo chiến thắng Jeopardy của IBM DeepQA / Watson, nói rằng anh ấy đã được định sẵn là một hệ thống lai: một nhóm gồm 20-25 người trong 4 năm từ nhiều ngành, bao gồm NLP, ngôn ngữ học tính toán, trò chơi lý thuyết, ngẫu nhiên và tối ưu hóa và các chuyên ngành khác đã làm việc trên nó.

10 thuật toán hàng đầu trong khai thác dữ liệu cung cấp một cái nhìn tổng quan nhẹ nhàng về các thuật toán truyền cảm hứng và hàng đầu. Tôi e rằng bạn sẽ cần cung cấp thêm chi tiết (ứng dụng nào? Mức độ chi tiết nào?) Để có câu trả lời hữu ích.
chl

Câu trả lời:


5

Điều đó thực sự có thể nghe hơi lạ trong cộng đồng các nhà thống kê, nhưng tôi khá chắc chắn rằng hầu hết các thuật toán học máy có thể được coi là một vấn đề tối thiểu hóa chức năng. Điều đó có nghĩa là điều này sẽ được bao phủ với tối ưu hóa toán học .

Một điều khác là bạn có thể sẽ cần tính toánđại số tuyến tính để hiểu tối ưu hóa là gì. Và để giải thích kết quả của bạn, bạn sẽ có một số nền tảng về lý thuyết xác suấtthống kê .


Đây có phải là một cộng đồng thống kê, có một trang web trao đổi ngăn xếp tốt hơn cho những người học máy không, tôi không chắc có một trang dành riêng?
image_doctor

1
Tôi không biết trang web trao đổi ngăn xếp máy học cụ thể. Nhưng trong điều này, bạn có thể tìm thấy rất nhiều người "học máy" (ví dụ như tôi), vì thống kê và học máy thực sự rất kết nối với nhau.
Dmitry Laptev

1

Câu hỏi này có thể là rộng, bạn nên nói thêm về những gì bạn sẽ sử dụng khai thác dữ liệu cho! Nhưng, khai thác dữ liệu về cơ bản là số liệu thống kê và phần lớn việc sử dụng AI mà tôi đã thấy cũng là số liệu thống kê. Vì vậy, toán học bạn cần là toán học bạn cần để thống kê: 1) phép tính và phân tích thực 2) xác suất 3) Đại số tuyến tính! Trong điều kiện thực tế, 3) có thể là quan trọng nhất, gần như bất cứ điều gì bạn sẽ làm (bao gồm sử dụng 1) và 2)) bạn sẽ phụ thuộc rất nhiều vào đại số tuyến tính. Vì vậy, hãy chắc chắn để có được, không chỉ các khái niệm, mà cả kỹ năng thao túng!

Nhiều hơn nữa được sử dụng, nhưng có thể chuyên biệt hơn. Vì vậy, sẽ không có ý nghĩa gì khi đưa ra lời khuyên chi tiết hơn cho đến khi bạn có câu hỏi chuyên biệt (và đã học 1), 2) & 3))


0

Có vẻ như một câu hỏi công bằng, tôi nên học môn toán nào làm nền tảng cho học máy?
Có lẽ đó là câu trả lời rộng. Như ML rút ra từ rất nhiều ngành.

Những người khác đã đề xuất, Đại số tuyến tính, Lý thuyết xác suất, Thống kê, Không gian số liệu và nhiều thứ khác đều có liên quan.

Có lẽ một cách tiếp cận khả thi là liệt kê một số thuật toán ML phổ biến nhất hãy xem chúng và điền vào toán học mà bạn cảm thấy không thoải mái.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.