Phân phối 'có thể kéo được có nghĩa là gì?


13

Ví dụ, trong mạng đối nghịch tổng quát, chúng ta thường nghe rằng suy luận là dễ dàng vì phân phối có điều kiện của x cho biến tiềm ẩn z là 'có thể điều chỉnh được'. Ngoài ra, tôi đã đọc ở đâu đó rằng máy Boltzmann và bộ tự động biến đổi đa dạng được sử dụng trong đó phân phối sau không thể điều chỉnh được nên cần áp dụng một số phép tính gần đúng. Bất cứ ai có thể cho tôi biết "có thể dễ dàng" nghĩa là gì, trong một định nghĩa nghiêm ngặt? Hoặc bất cứ ai có thể giải thích trong bất kỳ ví dụ nào tôi đã đưa ra ở trên, điều gì có thể dễ hiểu chính xác trong bối cảnh đó?


Điều này có liên quan.
Greenparker

1
Nó đơn giản có nghĩa là bạn có thể xử lý các tính toán có liên quan với phân phối. Vì vậy, những gì "có thể kéo dài" mở rộng theo thời gian!
kjetil b halvorsen

Câu trả lời:


10

Theo trí nhớ tốt nhất của tôi, tôi chưa bao giờ bắt gặp một định nghĩa chính thức cho điều này trong một văn bản thống kê, nhưng tôi nghĩ bạn có thể ghép chúng lại với nhau từ một vài bài đọc theo ngữ cảnh. Bắt đầu với Phân tích dữ liệu Bayes , p. 261:

Tính toán Bayes xoay quanh hai bước: tính toán phân bố sau, và tính toán phân phối dự báo sau, . Cho đến nay chúng tôi đã xem xét các ví dụ trong đó những ví dụ này có thể được tính toán phân tích ở dạng đóng [.]p(θ|y)p(y^|y)

Trở ngại nói chung là khả năng cận biên, mẫu số ở phía bên phải của quy tắc Bayes, có thể liên quan đến một tích phân không thể biểu thị bằng phân tích. Để biết thêm, tôi nghĩ rằng bạn sẽ thấy bài viết của wiki về biểu thức dạng đóng hữu ích cho ngữ cảnh (nhấn mạnh của tôi):

Trong toán học, biểu thức dạng đóng là biểu thức toán học có thể được đánh giá trong một số lượng hữu hạn các phép toán. Nó có thể chứa các hằng số, biến số, các hoạt động "nổi tiếng" nhất định (ví dụ: + - ×) và các hàm (ví dụ: gốc thứ n, hàm mũ, hàm logarit, hàm lượng giác và hàm hyperbol nghịch đảo), nhưng thường không giới hạn. Tập hợp các hoạt động và chức năng được thừa nhận trong biểu thức dạng đóng có thể thay đổi theo tác giả và bối cảnh .

Các vấn đề được cho là có thể xử lý được nếu chúng có thể được giải quyết theo biểu thức dạng đóng .

Nếu bạn đọc tiếp, bạn sẽ thấy một bảng các lớp biểu thức và "Biểu thức phân tích" bao gồm một số liên quan đến các hằng số chuẩn hóa của các phân phối gia đình theo cấp số nhân. Ví dụ, chức năng gamma trong phân phối gamma và chức năng Bessel trong von-Mises Fisher.

Có nghĩa là, chúng tôi sẵn sàng thừa nhận ít nhất những điều này vào định nghĩa của chúng tôi về "tính dễ điều khiển". (Có thể có các bản phân phối khác liên quan đến các lớp hoạt động được phân loại là "biểu thức phân tích"; Tôi thú nhận rằng tôi không quen.)


1
Đây là một câu trả lời tuyệt vời, +1. Đối với một số dấu hiệu cho thấy "dễ điều khiển" có thể có nghĩa là gì trong một thế kỷ trước, hãy duyệt qua nửa sau của Whittaker & Watson, Một quá trình phân tích hiện đại . Các chức năng Gamma và Bessel chỉ là phần nổi của tảng băng chìm.
whuber

1
@whuber On Whittaker and Watson: GN Watson có một vị trí nhỏ trong lịch sử thống kê khi đưa ra một ràng buộc cho sự bứt rứt thay cho Karl Pearson. ET Whittaker có một tổ chức lớn hơn với tư cách là cha mẹ của việc làm mịn spline avant la lettre .
Nick Cox

@whuber Cảm ơn bạn nhiều! Bài đăng này đã nhận được nhiều lượt bình chọn trong khoảng thời gian nhận xét của bạn, mà tôi lấy đó là bằng chứng giai thoại của "Bump Huber".
Sean Easter

3

Ngoài câu trả lời của Sean Easter, tôi sẽ cố gắng làm sáng tỏ từ góc độ chi phí tính toán.

Trước hết, hãy xác định các vấn đề có thể xử lý và khó xử lý là gì (Tham khảo: http://www.cs.ucc.ie/~dgb/cifts/toc/handout29.pdf ).

Vấn đề Tractable: một vấn đề có thể giải quyết được bằng thuật toán đa thức thời gian. Giới hạn trên là đa thức.

Vấn đề khó hiểu: một vấn đề không thể giải quyết bằng thuật toán đa thức thời gian. Giới hạn dưới là cấp số nhân.

Từ quan điểm này, một định nghĩa cho phân phối có thể điều khiển được là cần có thời gian đa thức để tính xác suất của phân phối này tại bất kỳ điểm nào.

Nếu một phân phối ở dạng biểu thức đóng, xác suất của phân phối này chắc chắn có thể được tính theo thời gian đa thức, trong thế giới của học viện, có nghĩa là phân phối có thể điều chỉnh được. Các phân phối có thể thu được bằng hoặc nhiều hơn thời gian theo cấp số nhân, điều này thường có nghĩa là với các tài nguyên tính toán hiện có, chúng ta không bao giờ có thể tính xác suất tại một điểm nhất định với thời gian tương đối "ngắn" (bất kỳ thời gian nào dài hơn thời gian đa thức đều dài ... ).


0

Một phân phối được gọi là dễ điều khiển nếu bất kỳ xác suất cận biên nào do nó gây ra có thể được tính trong thời gian tuyến tính


1
Bạn đang trích dẫn một số tài liệu tham khảo hoặc thẩm quyền? Đây là một đặc tính hấp dẫn nhưng đáng ngạc nhiên, vì vậy một số dấu hiệu cho thấy nó đến từ đâu và phạm vi áp dụng của nó sẽ được quan tâm.
whuber

2
Tôi đã tìm thấy nguồn mà tôi có nó từ "Sử dụng mạng Sum-Product cho phân loại đa nhãn" của Julissa Villanueva Llerena và Denis Deratani Mauá
malocho
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.