Suy luận xác suất là gì?


8

Tôi đang đọc sách giáo khoa Nhận dạng mẫu và Học máy của Chris Bishop . Tôi đã đi qua thuật ngữ suy luận xác suất nhiều lần. Tôi có một vài câu hỏi.

  1. Là suy luận xác suất chỉ áp dụng trong bối cảnh mô hình đồ họa?

  2. Sự khác biệt giữa suy luận thống kê truyền thống (giá trị p, khoảng tin cậy, yếu tố Bayes, v.v.) và suy luận xác suất là gì?

  3. Đây có phải là một thuật ngữ dành riêng cho cộng đồng CS hay nó cũng được sử dụng rộng rãi trong cộng đồng thống kê?


3
Theo tôi, đây chỉ là một giáo phái ưa thích (và một oxymoron) tái tạo thực tế rằng các số liệu thống kê dựa trên mô hình xác suất.
Tây An

1
Cảm ơn bạn @ Xi'an, tôi sẽ tiếp tục sử dụng suy luận thống kê trong bài báo và bài thuyết trình của mình.
Discretetimeisnice

Câu trả lời:


9

Suy luận xác suất sử dụng các mô hình xác suất , tức là các mô hình mô tả các vấn đề thống kê theo lý thuyết xác suất và phân phối xác suất. Mặc dù số liệu thống kê sử dụng lý thuyết xác suất khá nặng nề, bạn không thể nói rằng hai nguyên tắc đó là giống nhau (kiểm tra thảo luận trong chủ đề này ). Lưu ý rằng nhiều phương pháp thống kê và học máy không sử dụng rõ ràng lý thuyết xác suất để xác định các vấn đề, ví dụ như nhiều thuật toán phân cụm hoặc phương pháp phân loại hoạt động bằng cách giảm thiểu một số hàm mất mát, v.v. Nhưng sự khác biệt không phải là đơn giản, ví dụ như tính toán gần đúng Bayesian - về mặt lý thuyết, nó dựa trên suy luận Bayes (xác suất!), Nhưng nó liên quan đến các trường hợp chúng ta không có chức năng khả năng, vì vậy thay vì chúng ta sử dụng thước đo khoảng cách.


(+1): Tôi cảm thấy ít tự tin hơn về sự khác biệt vì tôi sẽ không phân loại số liệu thống kê bên ngoài mô hình xác suất. Cho rằng một nguyên lý thống kê thiết yếu là bao gồm đánh giá về độ không đảm bảo và rằng độ không đảm bảo này cần được mô hình hóa theo cấu trúc xác suất, tôi không thấy cách thống kê thoát khỏi khung này.
Tây An

Tôi cũng phản đối liên kết ABC. Mặc dù thật tuyệt khi thấy nó được đề cập, ABC ngược lại là một minh họa tốt về mô hình xác suất khi nó sao chép việc sản xuất chính xác một mẫu ngẫu nhiên theo một mô hình xác suất nhất định! Hàm khả năng không thể được tính toán bằng số không có nghĩa là mô hình xác suất không thoát, chỉ có điều nó phải được xem xét từ góc độ khác.
Tây An

@ Xi'an Tôi đồng ý với ý kiến ​​của bạn, nhưng nếu ai đó muốn phân biệt như vậy giữa các mô hình xác suất và không xác suất, thì nó có thể được định nghĩa như trên. Tuy nhiên, sự khác biệt là khá trừu tượng, mơ hồ và trong nhiều trường hợp vô dụng, vì những lý do bạn đưa ra. Về ABC, nó chỉ là một minh họa cho trường hợp mọi thứ trở nên mờ nhạt và sự khác biệt trở nên mơ hồ.
Tim

"Các phương pháp phân loại hoạt động bằng cách giảm thiểu một số chức năng mất", bạn có thể cung cấp một ví dụ về phương pháp không thể được coi là một mô hình xác suất không?
nbro

@nbro Tôi đã nói "không sử dụng rõ ràng ...", không phải là chúng không thể được tạo thành như thế này.
Tim

1

Tôi sẽ trả lời câu hỏi của bạn từ kinh nghiệm của tôi trong việc học Mô hình đồ họa xác suất (PGM) ở trường đại học và cách giáo viên PGM của tôi xác định suy luận xác suất . Biết tài liệu của lớp này dựa trên [1], tôi cho rằng bạn có thể tìm thấy câu trả lời chính xác hơn trong cuốn sách này.

Trong câu trả lời cho 2: Suy luận xác suất là một loại suy luận thống kê. Từ [2] và [3], suy luận thống kê đưa ra các đề xuất thống kê về dân số, bao gồm ước tính điểm , ước tính khoảng thời gian , từ chối giả thuyết , phân cụmphân loại . "Suy luận xác suất" đã được giới thiệu và được định nghĩa đại khái trong bối cảnh PGM là bất kỳ nhiệm vụ cận biên nào của hàm xác suất, cho dù đó là tính toán xác suất cận biên hay tìm kết quả có thể xảy ra nhất (ví dụ: phân loại). Do đó, nó đi vào định nghĩa của suy luận thống kê khi đưa ra một đề xuất về phân phối xác suất cơ bản của dân số.

Để minh họa về mặt toán học một số nhiệm vụ ngoài lề trong ngữ cảnh của PGM, hãy để là một tập hợp các biến ngẫu nhiên. Đối với một mạng hoặc mạng markovian với , sau đó các thói quen sau đây được coi là suy luận xác suất :X={X1,,Xn}(G,Pθ)(H,Pθ)Pθ

  • Tính toán xác suất cận biên hoặc có điều kiện: Với , chúng tôi muốn trả lời: E,XX

    Pθ(X=xE=e)= ?.

  • Nhận thức rõ nhất có thể xảy ra: Đối với , chúng tôi muốn trả lời: E,XX

    argminxPθ(X=xE=e)= ?.

Trả lời 1 và 3: Đó là lần đầu tiên tôi thấy thuật ngữ này. Thuật ngữ này có ý nghĩa, vì bạn suy luận về các câu hỏi liên quan trực tiếp đến xác suất. Tôi không thể trả lời liệu nó chỉ được sử dụng trong bối cảnh CS hay PGM.

[1] Koller, Daphne và Nir Friedman. 2009. Mô hình đồ họa xác suất: Nguyên tắc và kỹ thuật. Báo chí MIT.
[2] https://en.wikipedia.org/wiki/Statistic_inference
[3] https://encyclopediaofmath.org/wiki/Statistic_inference

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.