Nghịch lý của dữ liệu iid (ít nhất là đối với tôi)


24

Theo như kiến ​​thức tổng hợp (và khan hiếm) của tôi về các số liệu thống kê cho phép, tôi hiểu rằng nếu là các biến ngẫu nhiên, thì thuật ngữ này có nghĩa là chúng độc lập và phân phối giống hệt nhau.X1,X2,...,Xn

Mối quan tâm của tôi ở đây là thuộc tính cũ của các mẫu iid, có nội dung:

p(Xn|Xi1,Xi2,...,Xik)=p(Xn),

cho bất kỳ bộ sưu tập khác biệt của 's st .ij1ij<n

Tuy nhiên, người ta biết rằng tổng hợp các mẫu phân phối độc lập cung cấp thông tin về cấu trúc phân phối và kết quả là về trong trường hợp trên, do đó, thực sự không phải là trường hợp: p ( X n | X i 1 , X i 2 , . . . , X i k ) = p ( X n ) .Xn

p(Xn|Xi1,Xi2,...,Xik)=p(Xn).

Tôi biết rằng tôi là nạn nhân của ngụy biện nhưng tôi không biết tại sao. Xin hãy giúp tôi ra cái này


Bạn có biết quy tắc Bayes? Nghe nói kinh điển. Thống kê vs Bayes? Linh mục?
Matthew Gunn

1
Tôi không theo dõi cuộc tranh luận ở cuối câu hỏi của bạn. Bạn có thể rõ ràng hơn?
Glen_b -Reinstate Monica

@Glen_b chính xác thì bạn không theo dõi cái gì? Bạn có ý nghĩa gì khi kết thúc nó? Tôi đang cố gắng nói với các logic khác nhau cả bình đẳng và bất bình đẳng có vẻ hợp lý đó là một nghịch lý.
Cupitor

Không có nghịch lý ở đây - chỉ đơn thuần là thất bại trong việc áp dụng các định nghĩa phù hợp. Bạn không thể khẳng định có một nghịch lý khi bạn bỏ qua ý nghĩa của những từ bạn sử dụng! Trong trường hợp này, so sánh định nghĩa độc lập với xác suất sẽ cho thấy lỗi.
whuber

@whuber, tôi giả sử bạn đã nhận thấy "(ít nhất là đối với tôi)" trong tiêu đề câu hỏi của tôi và thực tế là tôi yêu cầu trợ giúp để tìm ra "ngụy biện" cho lập luận của tôi, điều này chỉ ra thực tế rằng điều này thực sự không phải là một nghịch lý thực sự
Cupitor

Câu trả lời:


30

Tôi nghĩ rằng bạn đang nhầm lẫn một mô hình ước tính của một phân phối với một biến ngẫu nhiên . Hãy viết lại giả định độc lập như sau: nói rằng nếu bạn biết phân phối cơ bản của X n ( và, ví dụ, có thể xác định nó bằng một tập hợp các thông số θ

(1)P(Xn|θ,Xi1,Xi2,,Xik)=P(Xn|θ)
Xnθ) sau đó phân phối không thay đổi do bạn đã quan sát một vài mẫu từ nó.

Ví dụ, nghĩ về là biến ngẫu nhiên đại diện cho kết quả của lần tung thứ n của đồng xu. Biết xác suất đầuđuôi cho đồng xu (mà, btw, giả sử được mã hóa bằng θ ) là đủ để biết phân phối của X n . Cụ thể, kết quả của các lần ném trước không thay đổi xác suất của đầu hoặc đuôi cho lần ném thứ n( 1 ) giữ.XnnθXnn(1)

Lưu ý, tuy nhiên, rằng .P(θ|Xn)P(θ|Xi1,Xi2,,Xik)


Cảm ơn nhiều. Khá đến mức. Khá buồn cười là tôi đã đoán được câu trả lời như vậy một thời gian trước nhưng tôi đã quên nó .... Vì vậy, theo như tôi hiểu thì ngụy biện đi với giả định "một mô hình" có thể bán được phân phối biến ngẫu nhiên. Tôi đã làm đúng chứ?
Cupitor

1
@Cupitor: Tôi rất vui vì nó hữu ích. Có, dựa trên mô hình, các biến ngẫu nhiên độc lập không ảnh hưởng lẫn nhau. Nhưng, khả năng một phân phối nhất định đã tạo ra một chuỗi các kết quả thay đổi như thế nào khi bạn thấy nhiều mẫu hơn từ phân phối cơ bản (đúng) (bất kể giả định độc lập).
Sobi

15

XθP(XnXn1,X1,θ)=P(Xnθ)

θθθ

Xnθ

Bayesian và thống kê cổ điển

xi

  • P(xi=H)θθ
  • θ

θθ

Cái này đi đâu

n

P(xn=Hxn1,xn2,,x1)=P(xn=H)=θ
θ

Một người Bayes sâu vào xác suất chủ quan sẽ nói rằng điều quan trọng là xác suất từ quan điểm của cô ấy! . Nếu cô ấy nhìn thấy 10 cái đầu liên tiếp, thì cái đầu thứ 11 có nhiều khả năng bởi vì 10 cái đầu liên tiếp khiến người ta tin rằng đồng xu bị nghiêng về phía đầu.

P(x11=Hx10=H,x9=H,,x1=H)>P(x1=H)

θθθ

P(x11=Hx10=H,x9=H,,x1=H,θ)=P(x1=Hθ)=θ

θθ

Ghi chú thêm

Tôi đã cố gắng hết sức để đưa ra một đoạn giới thiệu ngắn ở đây, nhưng những gì tôi đã làm là tốt nhất là khá hời hợt và các khái niệm theo một nghĩa nào đó khá sâu sắc. Nếu bạn muốn đi sâu vào triết lý xác suất, cuốn sách năm 1954 của Savage, Foundation of Statistics là một tác phẩm kinh điển. Google cho bayesian so với thường xuyên và một tấn công cụ sẽ xuất hiện.

Một cách khác để suy nghĩ về các trận hòa IID là định lý của de Finetti và khái niệm về khả năng trao đổi . Trong khuôn khổ Bayes, khả năng trao đổi tương đương với điều kiện độc lập trên một số biến ngẫu nhiên tiềm ẩn (trong trường hợp này là độ trễ của đồng xu).


Về bản chất, cách tiếp cận Bayes sẽ coi một tuyên bố "iid biến ngẫu nhiên" không phải là một tiên đề mà chúng phải là IID mà chỉ là một giả định rất mạnh mẽ rằng chúng là như vậy - và thậm chí bằng chứng mạnh mẽ hơn cho thấy rằng nó rất khó xảy ra các giả định là đúng, thì "sự không tin vào các điều kiện nhất định" sẽ được phản ánh trong các kết quả.
Peteris

Cảm ơn bạn rất nhiều vì câu trả lời thấu đáo của bạn. Tôi đã nâng cao nó, nhưng tôi nghĩ câu trả lời của Sobi, chỉ ra rõ ràng hơn vấn đề nằm ở đâu, tức là mặc nhiên giả định cấu trúc mô hình (hoặc theo như tôi hiểu)
Cupitor

1
@Matthew Gunn: gọn gàng, kỹ lưỡng, và giải thích rất rõ! Tôi đã học được một vài điều từ câu trả lời của bạn, cảm ơn!
Sobi
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.