Sự khác biệt giữa học tập và suy luận là gì?


20

Các tài liệu nghiên cứu về máy học thường coi việc học và suy luận là hai nhiệm vụ riêng biệt, nhưng đối với tôi không rõ sự khác biệt là gì. Trong cuốn sách này, ví dụ họ sử dụng số liệu thống kê Bayes cho cả hai loại nhiệm vụ, nhưng không cung cấp một động lực cho sự khác biệt đó. Tôi có một vài ý tưởng mơ hồ về những gì nó có thể nói về, nhưng tôi muốn thấy một định nghĩa vững chắc và có lẽ cũng phản bác hoặc mở rộng ý tưởng của tôi:

  • Sự khác biệt giữa suy ra các giá trị của các biến tiềm ẩn cho một điểm dữ liệu nhất định và tìm hiểu một mô hình phù hợp cho dữ liệu.
  • Sự khác biệt giữa trích xuất phương sai (suy luận) và tìm hiểu các bất biến để có thể trích xuất phương sai (bằng cách tìm hiểu động lực của không gian / quá trình / thế giới đầu vào).
  • Sự tương tự về thần kinh học có thể là tiềm năng / trầm cảm ngắn hạn (dấu vết bộ nhớ) so với tiềm năng / trầm cảm dài hạn.

4
Không chắc chắn liệu điều này có giúp ích gì không, nhưng trong thống kê, một điểm khác biệt là giữa việc bạn muốn nghĩ về việc học như suy luận (chủ yếu là Bayes) hay là ước tính (chủ yếu là Thường xuyên). Đối với trước đây, tìm hiểu về mọi thứ - các biến tiềm ẩn, tham số, dự đoán, mô hình - là một suy luận (trả về một phân phối). Đối với sau này, một số vấn đề học tập có thể là một suy luận và những vấn đề khác là ước tính (trả về một ước lượng và phạm vi không chắc chắn về mặt lý thuyết lấy mẫu theo lý thuyết cho nó).
liên hợp chiến

5
"Học" chỉ là một phép ẩn dụ gợi cho quá trình đào tạo thuật toán học máy. Tôi không nghĩ rằng có nhiều cái nhìn sâu sắc để đạt được ở đây.
Sycorax nói Phục hồi lại


1
@Winks Bạn có đọc những câu hỏi liên quan ở tất cả ? Không có câu trả lời nào làm nên sự khác biệt mà tôi đang yêu cầu rõ ràng.
Lenar Hoyt

1
@conjugatep Warrior Trong học máy, không ai có thể nói rằng "học về mọi thứ - các biến tiềm ẩn, tham số, dự đoán, mô hình - là một suy luận". Học tập và suy luận được coi là hoàn toàn riêng biệt mặc dù cả hai đều có thể tạo ra các bản phân phối.
Neil G

Câu trả lời:


11

Tôi đồng ý với câu trả lời của Neil G, nhưng có lẽ cụm từ thay thế này cũng giúp:

Hãy xem xét việc thiết lập một mô hình hỗn hợp Gaussian đơn giản. Ở đây chúng ta có thể nghĩ về các tham số mô hình là tập hợp các thành phần Gaussian của mô hình hỗn hợp (mỗi phương tiện và phương sai của chúng, và trọng lượng của mỗi người trong hỗn hợp).

Đưa ra một tập các tham số mô hình, suy luận là vấn đề xác định thành phần nào có khả năng đã tạo ra một ví dụ cụ thể, thường ở dạng "trách nhiệm" cho từng thành phần. Ở đây, các biến tiềm ẩn chỉ là định danh duy nhất cho thành phần nào tạo ra vectơ đã cho và chúng tôi đang suy ra thành phần nào có khả năng là. (Trong trường hợp này, suy luận là đơn giản, mặc dù trong các mô hình phức tạp hơn, nó trở nên khá phức tạp.)

Việc học là quá trình, đưa ra một tập hợp các mẫu từ mô hình, xác định các tham số mô hình (hoặc phân phối trên các tham số mô hình) phù hợp nhất với dữ liệu đã cho: chọn phương tiện, phương sai và trọng số của Gaussian.

Thuật toán học tối đa hóa kỳ vọng có thể được coi là thực hiện suy luận cho tập huấn luyện, sau đó học các tham số tốt nhất được đưa ra suy luận đó, sau đó lặp lại. Suy luận thường được sử dụng trong quá trình học theo cách này, nhưng nó cũng được quan tâm độc lập, ví dụ: chọn thành phần nào tạo ra một điểm dữ liệu nhất định trong mô hình hỗn hợp Gaussian, để quyết định trạng thái ẩn có khả năng nhất trong mô hình Markov ẩn, để áp đặt các giá trị còn thiếu trong một mô hình đồ họa tổng quát hơn, ....


1
Và một lời cảnh báo nhỏ mà người ta có thể chọn để chia nhỏ mọi thứ thành việc học và suy luận theo cách này, nhưng người ta cũng có thể chọn thực hiện toàn bộ như suy luận: stats.stackexchange.com/questions/180582/iêu
liên hợp

Tại sao nhiều dòng như vậy? Tôi muốn xem một câu trả lời đơn giản phân biệt chúng trong một hai câu. Ngoài ra, không phải ai cũng quen thuộc với GMM hoặc EM.
nbro

9

Suy luận là chọn một cấu hình dựa trên một đầu vào duy nhất. Học tập là chọn tham số dựa trên một số ví dụ đào tạo.

Trong khung mô hình dựa trên năng lượng (cách nhìn gần như tất cả các kiến ​​trúc máy học), suy luận chọn một cấu hình để giảm thiểu chức năng năng lượng trong khi giữ các tham số cố định; học chọn các tham số để giảm thiểu chức năng mất .

Như liên hợp chỉ ra, những người khác sử dụng thuật ngữ khác nhau cho cùng một điều. Ví dụ: Giám mục, sử dụng "suy luận" và "quyết định" để có nghĩa là học tập và suy luận tương ứng. Suy luận nhân quả có nghĩa là học tập. Nhưng bất cứ điều khoản nào bạn quyết định, hai khái niệm này là khác biệt.

Sự tương tự về thần kinh là một mô hình của các nơ-ron bắn là một cấu hình; một tập hợp các điểm mạnh liên kết là các tham số.


@mcb Tôi vẫn không biết ý của bạn là "phương sai". "Invariesces" thậm chí không phải là một từ trong từ điển. Vâng, có nhiều thuật toán học tập dựa trên cấu hình được suy luận như EM được mô tả trong câu trả lời của Dougal.
Neil G

@mcb Tôi cũng không hiểu câu hỏi của bạn; có lẽ nó sẽ giúp xác định một mô hình ví dụ và cụ thể về phân phối / phương sai / bất biến (?) mà bạn đang nói đến.
Dougal

Cảm ơn câu trả lời của bạn. Có lẽ tôi đã hiểu nhầm điều gì đó.
Lenar Hoyt

@NeilG Tôi tin rằng thuật ngữ này chủ yếu được sử dụng trong công việc tầm nhìn ML trong đó các quyết định phân loại phải là 'bất biến' để dịch đối tượng, xoay, thay đổi kích thước, v.v. Không thể tìm thấy một tài liệu tham khảo ngắn, nhưng có: en.wikipedia.org/wiki / Prior_ledgeledge_for_potype_recognition
liên hợp

@conjugatep Warrior Tôi có cảm giác đó là những gì anh ấy đang nhận được, nhưng tôi muốn xem liệu anh ấy có làm rõ câu hỏi của mình không.
Neil G

4

Điều này trông giống như sự nhầm lẫn lingo kỷ luật chéo cổ điển. OP dường như đang sử dụng thuật ngữ giống như khoa học thần kinh trong đó hai thuật ngữ được đề cập có thể có ý nghĩa khác nhau. Nhưng vì Cross xác thực thường xử lý các số liệu thống kê và gia công, tôi sẽ thử trả lời câu hỏi dựa trên việc sử dụng phổ biến các thuật ngữ này trong các lĩnh vực đó.

Trong thống kê cổ điển, suy luận đơn giản là hành động lấy những gì bạn biết về một mẫu và đưa ra một tuyên bố toán học về dân số mà nó đại diện (hy vọng). Từ sách giáo khoa kinh điển của Casella & Berger (2002): "Chủ đề của lý thuyết xác suất là nền tảng mà tất cả các số liệu thống kê được xây dựng ... thông qua các mô hình này, các nhà thống kê có thể rút ra các kết luận về dân số, suy luận chỉ dựa trên kiểm tra một phần của toàn bộ ". Vì vậy, trong thống kê, suy luận có liên quan cụ thể đến giá trị p, thống kê kiểm tra và phân phối mẫu, v.v.

Về việc học, tôi nghĩ bảng này từ Wasserman's All of Statistics (2003) có thể hữu ích:

nhập mô tả hình ảnh ở đây


Điều này không đồng ý với rất nhiều sách giáo khoa khác, bao gồm cả cuốn sách của Đức cha được đề cập trong các bình luận. Phân loại là một loại học tập có giám sát khi các biến mục tiêu là các thể loại. Chỉ riêng từ "ước tính" là mơ hồ: thông thường chúng ta có nghĩa là "ước tính mật độ" hoặc "ước tính tham số" hoặc "ước tính tuần tự" hoặc "ước tính khả năng tối đa".
Neil G

1
Ngoài ra, Bayes net không chỉ là một biểu đồ chu kỳ có hướng! Nó là một loại dag có các nút đại diện cho các mệnh đề và các cạnh của nó đại diện cho các phụ thuộc xác suất. Nó chỉ định các mối quan hệ độc lập có điều kiện.
Neil G

1
@NeilG Khá vậy. Bản dịch thống kê gần nhất có lẽ sẽ là "mô hình phương trình cấu trúc"
liên hợp

2
Và trong một số lượng thống kê mất tinh thần, cần có hai dòng về dữ liệu: CS: dữ liệu đào tạo, Thống kê: dữ liệu. CS: dữ liệu kiểm tra, Thống kê: wut?
liên hợp chiến

Stat 101: wut = mẫu khác (hy vọng ngẫu nhiên) từ dân số của bạn ...
Zoë Clark

-1

Thật kỳ lạ khi không ai khác đề cập đến điều này, nhưng bạn chỉ có thể suy luận trong trường hợp bạn có phân phối xác suất. Ở đây để trích dẫn Wiki, trong đó trích dẫn từ điển Oxford:

Suy luận thống kê là quá trình sử dụng phân tích dữ liệu để suy ra các thuộc tính của phân phối xác suất cơ bản (Từ điển thống kê Oxford)

https://en.wikipedia.org/wiki/Statistic_inference

Trong trường hợp mạng thần kinh truyền thống, các SVM k-NN hoặc vanilla bạn không có mật độ xác suất để ước tính, cũng không giả định về bất kỳ mật độ nào, do đó, không có suy luận thống kê nào ở đó. Chỉ đào tạo / học tập. Tuy nhiên, đối với hầu hết (tất cả?) Các thủ tục thống kê, bạn có thể sử dụng cả suy luận VÀ học tập, vì các quy trình này có một số giả định về sự phân bố dân số trong câu hỏi.


Cái này sai. Dù sao, bạn có thể hiểu các mạng thần kinh là sản xuất một bản phân phối nếu bạn muốn. Xem, ví dụ Amari 1998.
Neil G

Nó không sai, hoặc chỉ định. Bạn CÓ THỂ diễn giải, nhưng ban đầu không có cách giải thích như vậy.
SWIM S.

Đó là sai bởi vì mọi người sử dụng thuật ngữ suy luận với các mô hình như autoenciders.
Neil G

Vì vậy, có sai không vì một số nhóm người sử dụng thuật ngữ không chính xác? Hoặc bởi vì họ có một số giải thích xác suất cho NN của họ (tôi không quen thuộc lắm với bộ điều khiển tự động)? Tôi biện minh một cách hợp lý tại sao một thuật ngữ khác với thuật ngữ khác. Vì vậy, với định nghĩa trên, tôi thấy rằng những người sử dụng thuật ngữ suy luận với NN, k-NN hoặc SVM (trừ khi có giải thích xác suất) là khá lạm dụng ký hiệu.
SWIM S.
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.