Trường hợp thuật ngữ học hỏi một mô hình thế giới đến từ đâu


10

Thường thì tôi đã nghe các công cụ khai thác dữ liệu ở đây sử dụng thuật ngữ này. Là một nhà thống kê đã nghiên cứu về các vấn đề phân loại, tôi quen thuộc với thuật ngữ "đào tạo một bộ phân loại" và tôi cho rằng "học một mô hình" có nghĩa tương tự. Tôi không nhớ thuật ngữ "đào tạo một phân loại". Điều đó dường như mô tả ý tưởng phù hợp với một mô hình khi dữ liệu huấn luyện được sử dụng để có được ước tính tốt hoặc "cải thiện" các tham số mô hình. Nhưng học sẽ có nghĩa là để có được kiến ​​thức. Trong tiếng Anh đơn giản "học một mô hình" có nghĩa là để biết nó là gì. Nhưng thực tế chúng ta không bao giờ "biết" mô hình. Mô hình gần đúng thực tế nhưng không có mô hình nào là chính xác. Nó giống như Box nói "Không có mô hình nào là đúng nhưng một số là hữu ích."

Tôi sẽ được quan tâm để nghe phản ứng khai thác dữ liệu. Thuật ngữ này bắt nguồn như thế nào? Nếu bạn sử dụng nó, tại sao bạn thích nó?


Điều thú vị là "học một mô hình" có nghĩa là nhiều nhất là "ghi nhớ tất cả các tham số của nó" hoặc do đó, điều đó không đúng ngay cả khi bạn không tranh luận liệu "học" có phải là một từ tốt ở đây không. Trong ngôn ngữ của tôi (pl), danh pháp chính thức là "dạy một mô hình", mặc dù "học máy" được gọi là "học máy" chứ không phải là "dạy máy".

Thanh bên: Bạn có tham chiếu cho báo giá Hộp không.
entropy

Câu trả lời:


8

Tôi nghi ngờ nguồn gốc của nó là trong cộng đồng nghiên cứu mạng thần kinh nhân tạo, nơi mạng lưới thần kinh có thể được coi là học một mô hình dữ liệu thông qua việc sửa đổi các trọng số synap theo cách tương tự như xảy ra trong não người khi chúng ta học hỏi kinh nghiệm. Sự nghiệp nghiên cứu của tôi bắt đầu trong các mạng lưới thần kinh nhân tạo nên đôi khi tôi sử dụng cụm từ này.

Có lẽ sẽ có ý nghĩa hơn nếu bạn nghĩ rằng mô hình được mã hóa trong các tham số của mô hình, chứ không phải là phương trình, giống như mô hình tinh thần không phải là một thành phần vật lý có thể nhận dạng của não nhiều như một bộ tham số cài đặt cho một số tế bào thần kinh của chúng tôi.

Lưu ý rằng không có hàm ý rằng một mô hình tinh thần cũng nhất thiết phải đúng!


1
Trưởng nhóm nghiên cứu của tôi và tôi đã có cuộc thảo luận này, và tôi đã đăng một câu hỏi liên quan đến cuộc thảo luận này tại đây stats.stackexchange.com/questions/43559/ trên . Tôi đã hiểu rằng việc điều chỉnh mô hình, đào tạo, ước lượng và học tập chỉ có nghĩa là áp dụng một số phương pháp tối ưu hóa để tìm ra các tham số tốt nhất xác định mô hình của một hình thức cụ thể.
entropy

6

Thuật ngữ này khá cũ trong trí thông minh nhân tạo. Turing dành một đoạn dài về "Học tập Máy móc" vào năm 1950 của ông Computing Machinery and Intelligence giấy trong tâm trí , và chất lượng phác thảo ra học có giám sát. Bài viết gốc của Rosenblatt: Perceptron: Một mô hình xác suất để lưu trữ và tổ chức thông tin trong bài báo Brain từ năm 1958 nói nhiều về một "Mô hình toán học". Ở đây, tri giác là một "mô hình học tập"; mô hình không được "học".

Bài báo của Microsoft và McCullough 1943 - bài báo "mạng lưới thần kinh" ban đầu - không thực sự quan tâm đến việc học, hơn nữa làm thế nào người ta có thể xây dựng một phép tính logic (như hệ thống Hilbert hoặc Gentzen, nhưng tôi nghĩ rằng chúng đề cập đến Russell / Whitehead) có thể thực hiện suy luận. Tôi nghĩ rằng đó là bài báo "Perceptrons" đã giới thiệu một con số, trái ngược với quan niệm tượng trưng về học tập trong truyền thống này.

Có thể cho một cỗ máy học cách chơi cờ chỉ từ các ví dụ? Đúng. Nó có một mô hình để chơi cờ vua không? Đúng. Đây có phải là mô hình tối ưu (giả sử có một)? Hầu như chắc chắn là không. Nói một cách dễ hiểu, tôi đã "học cờ vua" nếu tôi có thể chơi cờ ok - hoặc có thể khá tốt. Điều đó không có nghĩa tôi là người chơi cờ tối ưu. Đây là ý nghĩa mà Turing đã mô tả "học" khi ông thảo luận về việc học cờ vua trong bài báo của mình.

Tôi rất không phù hợp với thuật ngữ tôi sử dụng. Vì vậy (ví dụ) đối với việc học trong giới hạn tôi sẽ nói "xác định", đối với việc học SVM tôi sẽ nói "đào tạo", nhưng đối với MCMC - "học" tôi sẽ nói "tối ưu hóa". Và ví dụ tôi chỉ gọi hồi quy là "hồi quy".


Câu hỏi của tôi không phải là về việc sử dụng thuật ngữ học tập trong phân loại mà là cụm từ "học một mô hình". Học máy rất quen thuộc nhưng "học một mô hình" là cụm từ tôi nghe lần đầu tiên ở đây trên trang web này.
Michael R. Chernick

Tôi đã thêm một chút ầm ĩ ở đó, nhưng bạn nói đúng, đây không phải là một câu trả lời hay, tôi đã học hỏi mà không cần thảo luận nhiều về "mô hình". Tôi sẽ xem liệu tôi có thể nhớ bất cứ điều gì hôm nay không, nhưng tôi có thể xóa nó vào tối nay nếu không có gì xuất hiện trong tâm trí.
Patrick Caldon

Tôi sẽ xóa câu trả lời này, nhưng rõ ràng một vài người thích nó! Tôi đoán đó là một bản tóm tắt nhỏ hợp lý về thuật ngữ "học tập" xuất phát từ ngữ cảnh này.
Patrick Caldon

+1 Tôi đang đưa ra một upvote bởi vì mặc dù một chút quan điểm của câu hỏi, nó có liên quan và thú vị và đã nhận được 3 upvote. Giữ nó trong.
Michael R. Chernick

2

Là một nhà nghiên cứu về Bioplausible Machine Learning, tôi hoàn toàn đồng ý rằng "không có mô hình nào đúng nhưng một số là hữu ích", và trên thực tế các mô hình và hình thức có sự thất bại mạnh mẽ như các tác giả nói về tối ưu hóa vấn đề, khi họ đang làm gì đang tối ưu hóa một mô hình, tức là khám phá không gian tham số của nó và tìm một địa phương hoặc hy vọng tối ưu toàn cầu. Điều này nói chung không phải là tối ưu cho vấn đề thực sự . Mặc dù người khởi tạo mô hình thường sử dụng thuật ngữ chính xác và đưa ra tất cả các giả định, hầu hết người dùng đều chú ý đến các giả định, thường được biết là không giữ, và cũng sử dụng ngôn ngữ ít chính xác hơn về "học" và "tối ưu hóa" và "tối ưu hóa" tham số hóa ".

Tôi nghĩ rằng việc tham số hóa tối ưu của một mô hình là ý nghĩa của mọi người trong Machine Learning, đặc biệt là trong Machine Learning được giám sát, mặc dù tôi không thể nói rằng tôi đã nghe "học một mô hình" rất nhiều - nhưng nó xảy ra, và trong khi đó đào tạo mô hình, máy tính học các tham số của mô hình. Ngay cả trong học tập không giám sát, "học" thường chỉ đơn giản là tham số hóa mô hình và hy vọng "học mô hình" là tham số hóa tối ưu của mô hình (mặc dù thường các cách tìm kiếm không gian tham số khác nhau tìm ra các giải pháp khác nhau mặc dù chúng có thể được chứng minh để tối ưu hóa điều tương tự). Tôi thực sự muốn sử dụng "đào tạo một mô hình"

Trên thực tế, hầu hết các nghiên cứu của tôi là về việc tìm hiểu mô hình về việc khám phá một mô hình tốt hơn, hoặc một mô hình hợp lý hơn về mặt tính toán và nhận thức / sinh học / sinh thái.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.