Lý do đằng sau gia đình phân phối theo cấp số nhân là gì?


10

Từ khóa học xác suất cơ bản, các phân phối xác suất như Gaussian, Poisson hoặc hàm mũ đều có động lực tốt. Sau khi nhìn chằm chằm vào công thức phân phối gia đình theo cấp số nhân trong một thời gian dài, tôi vẫn không nhận được bất kỳ trực giác nào.

fX(xθ)=h(x)exp(η(θ)T(x)A(θ))

Bất cứ ai có thể giúp tôi hiểu tại sao chúng ta cần nó ở nơi đầu tiên? Một số lợi thế của việc mô hình hóa một biến phản ứng là gia đình theo cấp số nhân so với bình thường là gì?

EDIT: Theo gia đình hàm mũ, tôi có nghĩa là lớp phân phối chung được mô tả ở đây .


1
TL; DR? Một phần lý do là sự thuận tiện toán học; nhiều vấn đề có thể được giải quyết một cách phân tích nếu bạn cho rằng pdf là từ gia đình này.
Vladislavs Dovgalecs

Câu trả lời:


10

Một số lợi thế của việc mô hình hóa một biến phản ứng là gia đình theo cấp số nhân so với bình thường là gì?

  1. Gia đình hàm mũ rộng hơn nhiều so với bình thường. Ví dụ, lợi thế của việc sử dụng Poisson hoặc nhị thức thay vì bình thường là gì? Một bình thường không được sử dụng nhiều nếu bạn có số lượng trung bình thấp. Điều gì về nếu dữ liệu của bạn liên tục nhưng rất sai lệch - có thể là thời gian hoặc số tiền? Gia đình hàm mũ bao gồm bình thường, nhị thức, Poisson và Gamma là trường hợp đặc biệt (trong số nhiều người khác)

  2. Nó kết hợp nhiều mối quan hệ khác nhau - có nghĩa là .

  3. Nó xuất phát từ việc cố gắng trả lời một câu hỏi dọc theo dòng chữ "phân phối nào là chức năng của một thống kê đầy đủ ", và các mô hình có thể được ước tính thông qua ML bằng cách sử dụng số liệu thống kê đủ đơn giản; điều này bao gồm các mô hình thông thường có sẵn trong các chương trình phù hợp với các mô hình tuyến tính tổng quát. Thật vậy, thống kê đầy đủ ( ) là rõ ràng trong hàm mật độ gia đình hàm mũ.T(x)

  4. Nó giúp dễ dàng tách rời mối quan hệ giữa phản hồi và yếu tố dự đoán khỏi phân phối có điều kiện của phản hồi (thông qua các chức năng liên kết). Ví dụ, bạn có thể điều chỉnh mối quan hệ đường thẳng với mô hình chỉ định phản hồi có điều kiện có phân phối gamma hoặc mối quan hệ theo cấp số nhân với phản hồi Gaussian có điều kiện trong khung GLM.

Đối với người Bayes, gia đình theo cấp số nhân khá thú vị bởi vì tất cả các thành viên của gia đình theo cấp số nhân đều có các linh mục liên hợp.


1
Tôi hơi mất điểm thứ 3 của bạn. Miễn là tôi nhớ lại, tất cả các phân phối xác suất từ ​​lớp xác suất đại học của tôi là các hàm của số liệu thống kê đầy đủ của họ. Nó có thể không phải là trường hợp cho các phân phối lạ như cauchy (có đủ số liệu thống kê tôi không chắc chắn) hoặc các phân phối luật quyền lực khác. Nhưng tại sao điều này là một vấn đề lớn?
denizen của miền bắc

1
Có thể tôi đã không thể hiện bản thân rõ ràng. Xem Koopman, BO, (1936), "Về phân phối thừa nhận một thống kê đầy đủ" , Giao dịch của Hiệp hội toán học Hoa Kỳ, 39: 3, 399-409. Đây là nơi phát sinh khái niệm gia đình theo cấp số nhân; ý nghĩa cụ thể trong đó gia đình hàm mũ là đặc biệt liên quan đến sự đầy đủ được giải thích trong trang đầu tiên và một vài dòng đầu tiên của trang thứ hai.
Glen_b -Reinstate Monica

5

Đối với tôi, động lực chính đằng sau các phân phối gia đình theo cấp số nhân là họ là các gia đình phân phối entropy tối đa được cung cấp một bộ số liệu thống kê đầy đủ và hỗ trợ. Nói cách khác, chúng là phân phối giả định tối thiểu.

Ví dụ: nếu bạn chỉ đo trung bình và phương sai của đại lượng có giá trị thực, lựa chọn mô hình giả định ít nhất là phân phối bình thường.

Từ quan điểm tính toán, có những lợi thế khác:

  • Chúng được đóng lại dưới "sự kết hợp bằng chứng". Đó là, sự kết hợp của hai khả năng độc lập từ cùng một gia đình hàm mũ luôn nằm trong cùng một hàm mũ và các tham số tự nhiên của nó chỉ đơn thuần là tổng các tham số tự nhiên của các thành phần. Điều này là thuận tiện cho thống kê Bayes.

  • Độ dốc của entropy chéo giữa hai phân bố gia đình hàm mũ là sự khác biệt của các tham số kỳ vọng của chúng. Điều này có nghĩa là hàm mất mát là một entropy chéo như vậy được gọi là hàm mất khớp phù hợp , thuận tiện cho việc tối ưu hóa.


2

Danh sách của Glen là tốt. Tôi sẽ thêm 1 ứng dụng nữa để bổ sung cho câu trả lời của anh ấy: dẫn xuất các linh mục liên hợp cho suy luận Bayes.

Một phần cốt lõi của suy luận Bayes là dẫn xuất các phân phối sau . Có trước liên hợp với khả năng có nghĩa là sau và trước sẽ thuộc cùng một loại phân phối xác suất.p(θ|y)p(y|θ)p(θ)p(θ)p(y|θ)p(y|θ)p(θ)

Thuộc tính hữu ích mà tôi đang đề cập là, vì khả năng quan sát được rút ra từ một họ hàm mũ một tham số của mẫun

p(y1,Giáo dục,yn|θ)= =Πp(yTôi|θ)αg(θ)nđiểm kinh nghiệm[h(θ)Σt(yTôi)] ,

chúng ta chỉ cần viết ra một liên hợp trước

p(θ)αg(θ)ν[h(θ)δ]

và sau đó các hậu thế hoạt động như

p(θ|y1,Giáo dục,yn)αg(θ)n+νđiểm kinh nghiệm[h(θ)(Σt(yTôi)+δ)]

Tại sao liên hợp này hữu ích? Bởi vì nó đơn giản hóa cả giải thích và tính toán của chúng tôi trong khi thực hiện suy luận Bayes. Điều đó cũng có nghĩa là chúng ta có thể dễ dàng đưa ra các biểu thức phân tích cho hậu thế mà không phải làm quá nhiều đại số.


0

Bạn muốn mô hình dữ liệu của bạn phản ánh quá trình tạo. Các biến Gaussian tạo ra 'quá trình' có các đặc điểm rất khác so với quy tắc theo cấp số nhân và không phải lúc nào cũng trực quan như tại sao. Đôi khi bạn cần đánh giá cao các đặc điểm phân phối khác. Lấy một ví dụ, xem xét rằng hàm nguy hiểm cho Gaussian đang tăng lên trong khi hàm mũ là phẳng. Như một ví dụ thực tế, giả sử Im sẽ chọc bạn trong các khoảng thời gian và 'khoảng thời gian chọc' sẽ được chọn bởi Gaussian hoặc hàm tạo hàm mũ. Theo một Gaussian, bạn sẽ thấy rằng các cú chọc là có thể dự đoán được và cảm thấy rất có khả năng sau những khoảng thời gian dài. Theo cấp số nhân, họ sẽ cảm thấy rất khó lường. Lý do cho điều này là do chức năng tạo, phụ thuộc vào hiện tượng cơ bản.


6
Câu hỏi mơ hồ liên quan đến việc OP đang hỏi về phân phối theo cấp số nhân hay gia đình theo cấp số nhân. Ở đây, bạn đang diễn giải Q là cái trước, trong khi @Glen_b đang hiểu nó là cái sau. OP hiện đã làm rõ Q của họ về gia đình theo cấp số nhân. Trong trường hợp đó, bạn sẽ xem xét chỉnh sửa này là về điều đó, hoặc có thể xóa nó?
gung - Tái lập Monica
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.