Làm rõ về giải thích khoảng tin cậy?


47

Hiểu biết hiện tại của tôi về khái niệm "khoảng tin cậy với độ tin cậy " là nếu chúng tôi cố gắng tính khoảng tin cậy nhiều lần (mỗi lần với một mẫu mới), nó sẽ chứa tham số chính xác của thời gian.1 - α1α1α

Mặc dù tôi nhận ra rằng điều này không giống như "xác suất tham số thực sự nằm trong khoảng này", có một điều tôi muốn làm rõ.

[Cập nhật chính]

Trước khi chúng tôi tính toán khoảng tin cậy 95%, có xác suất 95% rằng khoảng thời gian chúng tôi tính toán sẽ bao gồm tham số thực. Sau khi chúng tôi tính khoảng tin cậy và thu được một khoảng cụ thể , chúng tôi không còn có thể nói điều này. Chúng tôi thậm chí không thể đưa ra một số loại đối số không thường xuyên mà chúng tôi chắc chắn 95% rằng tham số thực sẽ nằm trong ; vì nếu chúng ta có thể, nó sẽ mâu thuẫn với các mẫu đối lập như thế này: Chính xác thì, khoảng tin cậy là gì?[ a , b ][a,b][a,b]

Tôi không muốn biến điều này thành một cuộc tranh luận về triết lý xác suất; thay vào đó, tôi đang tìm kiếm một lời giải thích chính xác, toán học về cách thức và lý do tại sao thấy khoảng thời gian cụ thể thay đổi (hoặc không thay đổi) xác suất 95% chúng ta có trước khi thấy khoảng đó. Nếu bạn lập luận rằng "sau khi thấy khoảng thời gian, khái niệm xác suất không còn có ý nghĩa", thì tốt thôi, chúng ta hãy làm việc theo cách giải thích xác suất trong đó nó ý nghĩa.[a,b]

Chính xác hơn:

Giả sử chúng ta lập trình một máy tính để tính khoảng tin cậy 95%. Máy tính thực hiện một số số khủng hoảng, tính toán một khoảng và từ chối hiển thị cho tôi khoảng thời gian cho đến khi tôi nhập mật khẩu. Trước khi tôi nhập mật khẩu và thấy khoảng thời gian (nhưng sau khi máy tính đã tính toán nó), xác suất mà khoảng đó sẽ chứa tham số thực sự là gì? Đó là 95%, và phần này không phải tranh luận : đây là cách giải thích xác suất mà tôi quan tâm cho câu hỏi cụ thể này (tôi nhận thấy có những vấn đề triết học lớn mà tôi đang đàn áp, và đây là cố ý).

Nhưng ngay khi tôi nhập mật khẩu và làm cho máy tính hiển thị cho tôi khoảng thời gian được tính, xác suất (khoảng đó chứa tham số thực) có thể thay đổi. Bất kỳ tuyên bố rằng xác suất này không bao giờ thay đổi sẽ mâu thuẫn với ví dụ trên. Trong ví dụ này, xác suất có thể thay đổi từ 50% đến 100%, nhưng ...

  • Có bất kỳ ví dụ nào mà xác suất thay đổi thành thứ gì đó không phải là 100% hoặc 0% (EDIT: và nếu vậy, chúng là gì)?

  • Có bất kỳ ví dụ nào mà xác suất không thay đổi sau khi thấy khoảng thời gian cụ thể (nghĩa là xác suất mà tham số thực nằm trong vẫn là 95%)?[ a , b ][a,b][a,b]

  • Làm thế nào (và tại sao) xác suất thay đổi nói chung sau khi thấy máy tính phun ra ?[a,b]

[Biên tập]

Cảm ơn tất cả các câu trả lời tuyệt vời và các cuộc thảo luận hữu ích!


1
Điều này có thể cung cấp một số điểm thú vị: en.wikipedia.org/wiki/Credible_interval
nico

Giả định của bạn rằng P (E | C) = 1 và P (E | C ') = 0 là không chính đáng. Tại sao bạn nói rằng nếu khoảng thực tế không chứa giá trị tham số thực thì cái sau này chắc chắn nằm ngoài nó?
thủy tinh

Tôi không chắc ý của bạn là "khoảng thời gian thực tế" hay "khoảng sau". Bạn có thể vui lòng làm rõ?
Elliott

@nico Cảm ơn đã liên kết. Mục đích của câu hỏi ban đầu của tôi là "lập luận của tôi dường như cho thấy rằng khoảng tin cậy có thể được hiểu là khoảng tin cậy Bayes, nhưng đây không phải là trường hợp, vì vậy có gì sai với lý luận của tôi". Nhưng tôi phải thừa nhận, tôi không hài lòng với khái niệm "xác suất khoảng đó chứa tham số đúng [không xác định] là 0 hoặc 1". Đối với tôi, điều đó giống như nói rằng "xác suất mà đồng xu rơi xuống, sau khi tôi lật nó nhưng trước khi tôi nhìn vào nó, là 0 hoặc 1"; Tôi không thấy lý do tại sao nó không phải là 1/2.
Elliott

@Elliot: Mèo Schrödinger xuất hiện trong tâm trí :) Tôi không đủ chuyên gia để đưa ra lời giải thích phù hợp cho bạn, nhưng tôi rất muốn thấy câu trả lời cho điều này. Tái bút: và đừng quên rằng đồng xu cũng có thể rơi ra rìa!
nico

Câu trả lời:


28

Tôi nghĩ vấn đề cơ bản là số liệu thống kê thường xuyên chỉ có thể gán xác suất cho thứ gì đó có thể có tần suất chạy dài. Cho dù giá trị thực của tham số có nằm trong một khoảng cụ thể hay không không có tần suất chạy dài, vì chúng ta chỉ có thể thực hiện thử nghiệm một lần, vì vậy bạn không thể chỉ định xác suất thường xuyên cho nó. Vấn đề phát sinh từ định nghĩa của một xác suất. Nếu bạn thay đổi định nghĩa về xác suất thành xác suất Bayes, thì vấn đề sẽ biến mất ngay lập tức vì bạn không còn bị ràng buộc với thảo luận về tần số chạy dài.

Xem câu trả lời (thay vì trả lời) của tôi cho một câu hỏi liên quan ở đây :

" Một người thường xuyên là người tin rằng probabflower đại diện cho tần số chạy dài với sự kiện nào xảy ra; nếu cần, anh ta sẽ phát minh ra một quần thể giả tưởng mà từ đó tình huống cụ thể của bạn có thể được coi là một mẫu ngẫu nhiên để anh ta có thể nói về tần số chạy dài một cách có ý nghĩa. bạn hỏi anh ta một câu hỏi về một tình huống cụ thể, anh ta sẽ không đưa ra câu trả lời trực tiếp, mà thay vào đó hãy đưa ra tuyên bố về dân số (có thể là tưởng tượng) này. "

Trong trường hợp khoảng tin cậy, câu hỏi chúng ta thường muốn hỏi (trừ khi chúng ta có vấn đề trong kiểm soát chất lượng chẳng hạn) là "đưa ra mẫu dữ liệu này, trả về khoảng nhỏ nhất chứa giá trị thực của tham số với xác suất X ". Tuy nhiên, một người thường xuyên không thể làm điều này vì thử nghiệm chỉ được thực hiện một lần và do đó không có tần số chạy dài nào có thể được sử dụng để chỉ định xác suất. Vì vậy, thay vào đó, người thường xuyên phải phát minh ra một quần thể thí nghiệm (mà bạn không thực hiện) mà từ đó thí nghiệm bạn thực hiện có thể được coi là một mẫu ngẫu nhiên. Sau đó, người thường xuyên cung cấp cho bạn một câu trả lời gián tiếp về quần thể thí nghiệm giả tưởng đó, thay vì trả lời trực tiếp cho câu hỏi bạn thực sự muốn hỏi về một thử nghiệm cụ thể.

Về cơ bản, đây là một vấn đề về ngôn ngữ, định nghĩa thường xuyên về dân số đơn giản là không cho phép thảo luận về xác suất của giá trị thực của một tham số nằm trong một khoảng cụ thể. Điều đó không có nghĩa là số liệu thống kê thường xuyên là xấu, hoặc không hữu ích, nhưng điều quan trọng là phải biết những hạn chế.

Về bản cập nhật lớn

Tôi không chắc chúng ta có thể nói rằng "Trước khi chúng ta tính toán khoảng tin cậy 95%, có xác suất 95% rằng khoảng thời gian chúng ta tính toán sẽ bao gồm tham số thực." trong khuôn khổ thường xuyên. Ở đây có một suy luận ngầm định rằng tần số chạy dài mà giá trị thực của tham số nằm trong các khoảng tin cậy được xây dựng bởi một phương pháp cụ thể nào đó cũng là xác suất rằng giá trị thực của tham số sẽ nằm trong khoảng tin cậy cho mẫu cụ thể dữ liệu chúng ta sẽ sử dụng. Đây là một suy luận hoàn toàn hợp lý, nhưng đó là một suy luận Bayes, không phải là một suy luận thường xuyên, vì xác suất rằng giá trị thực của tham số nằm trong khoảng tin cậy mà chúng ta xây dựng cho một mẫu dữ liệu cụ thể không có tự do chạy dài, vì chúng tôi chỉ có một mẫu dữ liệu.

Tuy nhiên, chúng ta có thể "đưa ra một số loại đối số không thường xuyên mà chúng tôi chắc chắn 95% rằng tham số thực sẽ nằm trong [a, b]", đó chính xác là khoảng thời gian đáng tin cậy của Bayes và đối với nhiều vấn đề về khoảng tin cậy của Bayes hoàn toàn trùng khớp với khoảng tin cậy thường xuyên.

"Tôi không muốn biến điều này thành một cuộc tranh luận về triết lý xác suất", đáng buồn là điều này là không thể tránh khỏi, lý do bạn không thể chỉ định một xác suất thường xuyên cho việc liệu giá trị thực của thống kê nằm trong khoảng tin cậy có phải là hậu quả trực tiếp không của triết lý thường xuyên của xác suất. Những người thường xuyên chỉ có thể gán xác suất cho những thứ có thể có tần số chạy dài, vì đó là cách những người thường xuyên xác định xác suất trong triết lý của họ. Điều đó không làm cho triết học thường xuyên sai, nhưng điều quan trọng là phải hiểu các giới hạn được áp đặt bởi định nghĩa của một xác suất.

"Trước khi tôi nhập mật khẩu và thấy khoảng thời gian (nhưng sau khi máy tính đã tính toán nó), xác suất của khoảng đó sẽ chứa tham số thực sự là bao nhiêu? Đó là 95% và phần này không phải tranh luận:" Điều này là không chính xác, hoặc ít nhất là khi đưa ra tuyên bố như vậy, bạn đã rời khỏi khuôn khổ thống kê thường xuyên và đã đưa ra một suy luận Bayes liên quan đến một mức độ hợp lý trong sự thật của một tuyên bố, thay vì tần suất dài. Tuy nhiên, như tôi đã nói trước đó, đó là một suy luận hoàn toàn hợp lý và tự nhiên.

Không có gì thay đổi trước hoặc sau khi nhập mật khẩu, bởi vì sự kiện mới hơn có thể được chỉ định một xác suất thường xuyên. Số liệu thống kê thường xuyên có thể khá phản cảm vì chúng ta thường muốn đặt câu hỏi về mức độ hợp lý của các tuyên bố liên quan đến các sự kiện cụ thể, nhưng điều này nằm ngoài sự thống kê của các thống kê thường xuyên, và đây là nguồn gốc của hầu hết các giải thích sai về thủ tục thường xuyên.


2
Vâng, đó là rất nhiều điểm tôi đang thực hiện, tuyên bố thứ hai không thực sự là một tuyên bố về đồng tiền cụ thể này. Đó là một tuyên bố về một quần thể tiền xu tưởng tượng mà hầu hết mọi người đều không hài lòng như một tuyên bố về đồng tiền cụ thể của chúng tôi. Tuy nhiên, để thực hiện bước nhảy vọt đó, chúng tôi đang áp dụng trực giác của Bayes về xác suất và bỏ qua khoảng tin cậy thực sự là gì. Không có vấn đề gì trong việc gán xác suất cho trạng thái của đồng tiền, miễn là chúng ta tránh xa định nghĩa xác suất thường xuyên.
Dikran Marsupial

2
Để làm rõ, để nói rằng "hãy tưởng tượng nhiều trường hợp riêng biệt của thời điểm bắt đầu; bạn mong đợi khoảng một nửa trong số đó tạo ra đầu" là lý do thường xuyên hoàn toàn chính xác. Tuy nhiên, để đi từ đó đến "do đó xác suất mà đồng tiền hạt nhân này cũng là 0,5" không phải là xác suất được áp dụng cho một thứ không có tần suất chạy dài vì nó chỉ có thể xảy ra một lần và một lần duy nhất. Mặc dù đó là lý do Bayes hoàn toàn đúng, vì xác suất Bayes là một tuyên bố về tính hợp lý của một đề xuất (có thể dựa trên tần suất chạy dài trong dân số).
Dikran Marsupial

1
Câu trả lời của ông cho cả hai câu hỏi thực sự sẽ là một tuyên bố về tỷ lệ dân số tưởng tượng về những đồng xu sẽ rơi xuống đầu. Nhưng có khả năng là điều này sẽ không được làm rõ, vì mọi người thường muốn được giúp đỡ (câu trả lời gián tiếp thường không hữu ích), và các số liệu thống kê thường xuyên là khá trực quan và người thường xuyên có thể tránh né điểm này để tránh sự hoang mang. Nếu được ghim xuống để đưa ra một thống kê xác suất về một lần lật cụ thể, một người thường xuyên giỏi sẽ đơn giản từ chối trả lời - nó nằm ngoài giới hạn của các số liệu thống kê thường xuyên.
Dikran Marsupial

1
Về cơ bản, người thường xuyên không thực sự trả lời câu hỏi của bạn, anh ta sẽ đưa ra tuyên bố về dân số lật đồng xu và khiến bạn phải suy luận rằng xác suất của một người đứng đầu trong lần lật đó là tương đương với tỷ lệ trong dân số ngầm . Nhưng đó sẽ là suy luận Bayes của bạn, không phải của anh ấy.
Dikran Marsupial

1
@Aaron Chắc chắn, bạn có thể nói "xác suất là 0 hoặc 1" cho nhiều thứ, nhưng câu trả lời đó hoàn toàn không mua gì cho chúng tôi (ví dụ: nếu chúng tôi muốn trả lời một câu hỏi cụ thể về việc chúng tôi nên đặt cược bao nhiêu cho một trò chơi hoặc liệu hoặc không chúng ta nên khởi động một tàu con thoi không gian). Bên cạnh đó, những điều "có thể xảy ra" là: (1) đồng xu rơi xuống đầu và bạn che nó, (2) đồng xu rơi xuống đuôi và bạn che nó; trong một "quần thể tưởng tượng" của nhiều thử nghiệm "lật và che", khoảng 50% kết quả là bạn nhìn thấy những cái đầu.
Elliott

14

Cập nhật lớn, câu trả lời mới lớn. Hãy để tôi cố gắng giải quyết rõ ràng điểm này, bởi vì đó là vấn đề nằm ở đâu:

"Nếu bạn lập luận rằng" sau khi thấy khoảng thời gian, khái niệm xác suất không còn có ý nghĩa ", thì tốt thôi, chúng ta hãy làm việc theo cách giải thích xác suất trong đó nó có ý nghĩa."

Các quy tắc xác suất không thay đổi nhưng mô hình của bạn cho vũ trụ thì có. Bạn có sẵn sàng định lượng niềm tin trước đây của mình về một tham số bằng cách sử dụng phân phối xác suất không? Là cập nhật phân phối xác suất đó sau khi xem dữ liệu là một điều hợp lý để làm? Nếu bạn nghĩ như vậy thì bạn có thể lập báo cáo như . Phân phối trước của tôi có thể đại diện cho sự không chắc chắn của tôi về trạng thái tự nhiên thực sự , không chỉ là sự ngẫu nhiênP(θ[L(X),U(X)]|X=x)như thường được hiểu - nghĩa là, nếu tôi chỉ định phân phối trước cho số lượng bóng đỏ trong một chiếc bình không có nghĩa là tôi nghĩ số lượng bóng đỏ là ngẫu nhiên. Nó đã được sửa, nhưng tôi không chắc về nó.

Một số người trong đó có tôi đã nói điều này, nhưng nếu bạn không sẵn sàng để gọi một biến ngẫu nhiên sau đó báo cáo kết quả P ( θ [ L ( X ) , U ( X ) ] | X = x ) không có ý nghĩa. Nếu tôi là một frequentist, tôi đang điều trị θ như một số lượng cố định và tôi không thể gán cho một phân bố xác suất để nó. Tại sao? Bởi vì nó đã được sửa, và cách giải thích của tôi về xác suất là về tần số dài hạn. Số lượng các quả bóng màu đỏ trong chiếc bình không bao giờ thay đổi. θ là những gì θθP(θ[L(X),U(X)]|X=x)θθθLà. Nếu tôi rút ra một vài quả bóng thì tôi có một mẫu ngẫu nhiên. Tôi có thể hỏi điều gì sẽ xảy ra nếu tôi mất một loạt các mẫu ngẫu nhiên - đó là để nói, tôi có thể nói về vì khoảng thời gian phụ thuộc vào mẫu, đó là (chờ nó!) ngẫu nhiên.P(θ[L(X),U(X)])

Nhưng bạn không muốn điều đó. Bạn muốn - xác suất mà tôi khoảng thời gian này được xây dựng với mẫu của tôi quan sát (và bây giờ cố định) là những gì chứa tham số. Tuy nhiên, một khi bạn đã lạnh trên X = x sau đó với tôi, một frequentist, không có gì là ngẫu nhiên trái và báo cáo kết quả P ( q [ L ( X ) , U ( X ) ] |P(θ[L(X),U(X)]|X=x)X=x không có ý nghĩa theo bất kỳ cách có ý nghĩa.P(θ[L(X),U(X)]|X=x)

Cách duy nhất có nguyên tắc (IMO) để thực hiện một tuyên bố về là để định lượng sự không chắc chắn của chúng tôi về một tham số với một (trước) phân bố xác suất và cập nhật mà phân phối với thông tin mới thông qua Định lý Bayes. Mọi cách tiếp cận khác mà tôi đã thấy là một sự gần đúng mờ nhạt đối với Bayes. Bạn chắc chắn không thể làm điều đó từ một quan điểm thường xuyên.P(θ[L(X),U(X)]|X=x)

Điều đó không có nghĩa là bạn không thể đánh giá các quy trình truyền thống thường xuyên theo quan điểm Bayes (thường thì khoảng tin cậy chỉ là khoảng tin cậy theo các mục sư thống nhất) hoặc việc đánh giá các ước lượng / khoảng đáng tin cậy của Bayes từ góc độ thường xuyên là có giá trị (Tôi nghĩ rằng nó có thể). Không phải nói rằng thống kê cổ điển / thường xuyên là vô ích, bởi vì nó không phải là. Đó là những gì nó là, và chúng ta không nên cố gắng để làm cho nó nhiều hơn.

Bạn có nghĩ rằng sẽ hợp lý khi đưa ra một tham số phân phối trước để thể hiện niềm tin của bạn về vũ trụ? Có vẻ như nó từ ý kiến ​​của bạn mà bạn làm; theo kinh nghiệm của tôi, hầu hết mọi người sẽ đồng ý (đó là một trò đùa nửa vời mà tôi đã đưa ra trong nhận xét của mình với câu trả lời của @G. Jay Kerns). Nếu vậy, mô hình Bayes cung cấp một cách mạch lạc logic để lập báo cáo về . Cách tiếp cận thường xuyên đơn giản là không.P(θ[L(X),U(X)]|X=x)


1
(+1) được thực hiện rất tốt, một lần nữa, và phát hiện ra điểm chết.

+1 Nhận xét tương tự như trên (xem câu trả lời của G. Jay Kerns); Điều này thực sự hữu ích.
Elliott

Bounty schmounty :) Tôi rất vui vì bạn thấy nó hữu ích.
JMS

11

OK, bây giờ bạn đang nói! Tôi đã bỏ phiếu để xóa câu trả lời trước đó vì nó không có ý nghĩa với câu hỏi được cập nhật lớn này.

Trong câu hỏi mới, được cập nhật này, với một máy tính tính toán khoảng tin cậy 95%, theo cách giải thích thường xuyên chính thống, đây là câu trả lời cho câu hỏi của bạn:

  1. Không.
  2. Không.
  3. Khi khoảng thời gian được quan sát, nó không còn là ngẫu nhiên nữa và không thay đổi. (Có lẽ khoảng thời gian là .) Nhưng θ không làm thay đổi, một trong hai, và chưa bao giờ thay đổi. (Có thể là θ = 7. ) Xác suất thay đổi từ 95% thành 0% vì 95% các khoảng thời gian máy tính tính toán bao gồm 7, nhưng 100% các khoảng [ 1 , 3 ] KHÔNG bao gồm 7.[1,3]θθ=7[1,3]

(Bằng cách này, trong thế giới thực, người thí nghiệm không bao giờ biết rằng , có nghĩa là người thí nghiệm không bao giờ có thể biết liệu xác suất đúng [ 1 , 3 ] bìa θ là zero hoặc một. (S), ông chỉ có thể nói rằng nó phải là một hay khác.) đó, cộng với thí nghiệm có thể nói rằng 95% của khoảng thời gian của máy tính bao gồm θ , nhưng chúng tôi biết rằng rồi.θ=7[1,3]θθ

Tinh thần của câu hỏi của bạn tiếp tục gợi ý trở lại kiến thức của người quan sát và làm thế nào nó liên quan đến nơi nằm. Đó (có lẽ) là lý do tại sao bạn đang nói về mật khẩu, về máy tính tính toán khoảng thời gian mà không thấy bạn nó chưa, vv . Tôi đã nhìn thấy trong ý kiến của bạn để trả lời rằng nó dường như không đạt yêu cầu / bất lịch sự để có nghĩa vụ cam kết 0 hoặc 1, sau khi tất cả, tại sao có thể chúng ta không tin rằng nó là 87%, hoặc 15 / 16 , hoặc thậm chí 99% ?? ? Nhưng đó chính xác là sức mạnh - và đồng thời là gót chân của Achilles - của khuôn khổ thường xuyên: kiến ​​thức / niềm tin chủ quan của người quan sát là không liên quan. Tất cả những gì quan trọng là một tần số tương đối dài hạn. Không hơn không kém.θ15/16

Là một BTW cuối cùng: nếu bạn thay đổi cách giải thích về xác suất (mà bạn thực sự đã chọn không làm cho câu hỏi này), thì câu trả lời mới là:

  1. Đúng.
  2. Đúng.
  3. Xác suất thay đổi vì xác suất = kiến ​​thức chủ quan, hoặc mức độ niềm tin và kiến ​​thức của người quan sát đã thay đổi. Chúng tôi trình bày kiến ​​thức với các bản phân phối trước / sau và khi có thông tin mới, các hình thái trước sẽ chuyển sang phần sau (thông qua Quy tắc của Bayes).

(Nhưng để tiết lộ đầy đủ, thiết lập mà bạn mô tả không khớp với cách diễn giải chủ quan. Chẳng hạn, chúng tôi thường có khoảng tin cậy trước 95% trước khi bật máy tính, sau đó chúng tôi kích hoạt và sử dụng máy tính để cung cấp cho chúng tôi khoảng tin cậy sau 95% thường cao hơn đáng kể so với trước đó.)


Lần nữa! :) Làm tốt.
JMS

3
Tôi chỉ nên chỉ ra rằng sự không hài lòng của xác suất Bayes không nhất thiết là chủ quan, vì vậy đó không thực sự là một thế mạnh của phương pháp thường xuyên. Trong trường hợp của phương pháp Bayes khách quan đối với "xác suất xảy ra sự cố hạ cánh bằng đồng xu", việc sử dụng một thông tin không chính xác trước đó không liên quan đến sự chủ quan. Sức mạnh thực sự của cách tiếp cận thường xuyên nằm ở các vấn đề như kiểm soát chất lượng, trong đó việc nói về các thử nghiệm lặp lại và tần suất chạy dài là điều tự nhiên. Nó chỉ gặp khó khăn khi bạn đặt câu hỏi về các sự kiện cụ thể.
Dikran Marsupial

@JMS, cảm ơn. @Dikran, thật khó để nói về điều đó với 544 ký tự trong một hộp nhỏ trên màn hình máy tính. Tóm lại: Tôi đồng ý với bạn rằng từ "Bayes" không đồng nghĩa với "chủ quan". Và không có điểm nào cố gắng tìm hiểu xem sức mạnh thực sự của một trong hai cách tiếp cận thực sự nằm ở đâu. Điểm mấu chốt: tất cả chúng ta đều có thể đồng ý về tần suất tương đối dài hạn, nhưng thường xuyên hơn không, hậu thế của bạn sẽ khác với tần suất của tôi.

2
@Dikran Marsupial Bạn làm cho một điểm tốt. Tôi chỉ nói thêm rằng một khi chúng ta chuyển các vấn đề về đồ chơi sang mô hình ứng dụng thực tế, thường thì sự chủ quan thực sự quan trọng xuất hiện thông qua cách chúng ta xác định khả năng, không nhất thiết phải là các bản phân phối trước đó (Những quan sát đó có thực sự trao đổi được không? Gaussian? Vân vân). Theo cách đó tính chủ quan được xây dựng thành một phần lớn các số liệu thống kê dựa trên mô hình, Bayes và người thường xuyên như nhau.
JMS

+1 Cảm ơn câu trả lời hay. Điều này chắc chắn xứng đáng với một tiền thưởng, nhưng để tránh trở thành chính trị, cuối cùng tôi đã đi bằng cách nâng cao.
Elliott

6

Tôi sẽ ném vào hai xu của tôi (có thể chuyển hướng một số câu trả lời trước đây). Đối với một người thường xuyên, bản thân khoảng tin cậy thực chất là một biến ngẫu nhiên hai chiều: nếu bạn làm lại thí nghiệm một lần, thì khoảng tin cậy mà bạn ước tính (nghĩa là: tính từ dữ liệu mới tìm thấy của bạn mỗi lần) sẽ khác nhau . Như vậy, hai ranh giới của khoảng là các biến ngẫu nhiên.

Do đó, 95% CI có nghĩa là không có gì ngoài sự đảm bảo (với tất cả các giả định của bạn dẫn đến CI này là chính xác) rằng tập hợp các biến ngẫu nhiên này sẽ chứa giá trị thực (một biểu thức rất thường xuyên) trong 95% các trường hợp.

Bạn có thể dễ dàng tính khoảng tin cậy cho giá trị trung bình của 100 lần rút từ phân phối chuẩn thông thường. Sau đó, nếu bạn rút 10000 lần 100 giá trị từ phân phối chuẩn thông thường đó và mỗi lần tính khoảng tin cậy cho giá trị trung bình, bạn thực sự sẽ thấy rằng 0 nằm trong đó khoảng 9500 lần.

Thực tế là bạn đã tạo khoảng tin cậy chỉ một lần (từ dữ liệu thực tế của bạn) thực sự làm giảm xác suất của giá trị thực trong khoảng đó xuống 0 hoặc 1, nhưng nó không thay đổi xác suất của khoảng tin cậy là một biến ngẫu nhiên để chứa giá trị thực.

Vì vậy, điểm mấu chốt: xác suất của bất kỳ khoảng tin cậy (trung bình) 95% nào chứa giá trị thực (95%) không thay đổi và xác suất của một khoảng cụ thể (CI hoặc bất cứ điều gì) không chứa giá trị thực (0 hoặc 1). Xác suất của khoảng thời gian máy tính biết nhưng thực tế bạn không phải là 0 hoặc 1 (vì đó là một khoảng cụ thể), nhưng vì bạn không biết nó (và, theo kiểu thường xuyên, không thể tính toán lại khoảng thời gian tương tự này vô cùng nhiều lần một lần nữa từ cùng một dữ liệu), tất cả những gì bạn phải làm là xác suất của bất kỳ khoảng thời gian nào.


Lưu ý bên lề: trình kiểm tra chính tả của trang web này tìm thấy từ thường xuyên để xứng đáng với gạch chân. Là trang web này bí mật làm chủ bởi người Bayes? Ồ, tôi đoán là không phải, vì người Bayes có phần gạch chân của riêng họ :-)
Nick Sabbe

4

Lý do khoảng tin cậy không chỉ định "xác suất tham số thực nằm trong khoảng" là vì một khi khoảng được chỉ định, tham số sẽ nằm trong đó hoặc không. Tuy nhiên, đối với khoảng tin cậy 95% chẳng hạn, bạn có 95% cơ hội tạo khoảng tin cậy có chứa giá trị. Đây là một khái niệm khá khó nắm bắt, vì vậy tôi có thể không nói rõ nó. Xem http://frank.itlab.us/datamodel/node39.html để biết thêm.


2
Giả sử bạn lập trình máy tính để tính khoảng tin cậy, nhưng bạn không nhìn vào đầu ra. Trước khi bạn nhìn thấy đầu ra, bạn biết rằng có 95% khả năng khoảng đó chứa tham số đúng (giống như trước khi bạn thấy kết quả của việc lật đồng xu, bạn biết rằng có 50% khả năng đứng đầu). Bằng cách nào sau đó, việc nhìn vào đầu ra thay đổi xác suất này, với điều kiện là bạn không biết đúng tham số ngay từ đầu (Tôi đồng ý rằng việc nhìn vào kết quả của việc lật đồng xu sẽ thay đổi xác suất của các đầu từ 50% thành 1 hay 0)?
Elliott

Hơn nữa, trong khi tôi đồng ý rằng có một sự khác biệt, tôi tự hỏi có gì sai với "đối số" ở trên của tôi cho thấy rằng chúng giống nhau.
Elliott

2
@Elliott Câu hỏi của bạn có vẻ giống với câu hỏi tương tự này: bạn lật một đồng tiền công bằng. Ergo, xác suất của người đứng đầu là 50%. Bây giờ bạn nhìn vào đồng tiền và nó là người đứng đầu. Bằng cách nào điều này thay đổi xác suất của người đứng đầu? Câu trả lời là không, bởi vì xác suất đề cập đến thủ tục lật đồng xu, không liên quan đến kết quả. Dường như với tôi, ví dụ mẫu mà bạn đề cập đến hoạt động theo cách tương tự: quy trình có thể có 50% cơ hội bao trùm tham số, nhưng sau thực tế có thể xác minh rằng tham số thực sự được bao phủ. Vậy thì sao?
whuber

Tôi không nói về việc thay đổi xác suất rằng một đồng tiền công bằng sẽ đứng đầu; thay vào đó, tôi đang nói về việc thay đổi xác suất mà đồng tiền cụ thể này sẽ đứng đầu. Sau khi tôi lật nó và trước khi tôi nhìn vào nó, tôi sẽ lập luận rằng xác suất trong câu hỏi là 50% vì khoảng một nửa các trường hợp như vậy liên quan đến một đồng xu có đầu lên. Mặt khác, sau khi tôi nhìn vào nó và thấy những cái đầu, 100% những trường hợp như vậy liên quan đến một đồng xu có đầu ngẩng lên (những trường hợp có đuôi bị loại bỏ khi tôi nhìn vào đồng xu và không nhìn thấy đầu).
Elliott

Tôi đồng ý rằng sau khi thực tế, có thể xác minh rằng tham số đã được bảo hiểm. Câu trả lời của tôi cho "vậy thì sao?" là "vì vậy lập luận trên của tôi (trong câu hỏi ban đầu) phải sai và tôi tự hỏi có gì sai với nó".
Elliott

4

Tôi không nghĩ rằng một người thường xuyên có thể nói rằng có bất kỳ xác suất nào về giá trị (dân số) thực sự của một thống kê nằm trong khoảng tin cậy cho một mẫu cụ thể. Nó cũng vậy, hoặc là không, nhưng không có tần suất chạy dài cho một sự kiện cụ thể, chỉ là dân số các sự kiện mà bạn sẽ nhận được bằng cách thực hiện lặp lại một quy trình thống kê. Đây là lý do tại sao chúng ta phải tuân theo các tuyên bố như "95% khoảng tin cậy được xây dựng sẽ chứa giá trị thực của thống kê", nhưng không "có xác suất ap% là giá trị thực nằm trong khoảng tin cậy được tính cho cụ thể này mẫu vật". Điều này đúng với bất kỳ giá trị nào của p, đơn giản là nó không thể thực hiện được với định nghĩa thường xuyên về xác suất thực sự là gì. Một Bayes có thể đưa ra tuyên bố như vậy bằng cách sử dụng một khoảng đáng tin cậy mặc dù.


3

E[a,b]

E~(L(X),U(X))

Chỉnh sửa: @G. Jay Kerns làm cho cuộc tranh luận tốt hơn tôi và gõ nhanh hơn, vì vậy có lẽ chỉ cần di chuyển theo :)


[a,b]

2
|

Tôi không biết, của bạn là tại chỗ. :-)

2

E[a,b]ECCP(E|C)=P(E)P(E|C)=P(E)

P(E|C)=1P(E|C)=0


Xem xét rằng tôi đã xác định C là sự kiện mà khoảng thời gian cụ thể này, [a, b], chứa tham số thực, tôi không chắc chắn rằng tôi đồng ý rằng E và C / C 'là độc lập: biết rằng C xảy ra đảm bảo rằng E xảy ra .
Elliott

Nhưng C là một biến ngẫu nhiên! Bạn đang thay đổi định nghĩa về tất cả những sự kiện này sau khi mọi thứ đã xảy ra. Nói cách khác, nếu bạn xác định C là sự kiện cụ thể này, thì C không còn là khoảng tin cậy nữa.
raegtin

2
Vấn đề là nếu C là sự kiện mà khoảng thời gian chứa tham số thực trong lần chạy thử nghiệm cụ thể này, thì nó không có tần suất chạy dài (lần chạy cụ thể đó chỉ có thể xảy ra một lần) và do đó bạn không thể chỉ định một xác suất thường xuyên cho nó. Đây là lý do tại sao định nghĩa về khoảng tin cậy thường xuyên là về dân số của các thí nghiệm được nhân rộng. Bạn dường như đang áp dụng lý luận Bayes cho một thiết lập thường xuyên, và có sự không phù hợp với các định nghĩa về xác suất.
Dikran Marsupial

Đây là một cách khác để xem xét nó. Những gì bạn dường như đang làm là như sau: chạy một phép tính để có được khoảng tin cậy [a, b]. Xác định C là sự kiện mà khoảng tin cậy đặc biệt này [a, b] chứa tham số thực. Cũng xác định E là sự kiện mà khoảng thời gian cụ thể này [a, b] chứa tham số thực. Như vậy, E và C là cùng một sự kiện!
raegtin

Đó là những gì bạn đang thực sự làm. Có vẻ như bạn nghĩ rằng bạn đang làm như sau (mà bạn không phải): chạy phép tính số 1 để có một khoảng [a, b]. Xác định E là sự kiện mà khoảng thời gian cụ thể này [a, b] chứa tham số thực. Tiếp theo, hãy quên tính toán số 1 và xác định C là sự kiện mà bất kỳ khoảng tính toán nào khác [a ', b'] có chứa tham số thực. Trong trường hợp này, E và C là độc lập.
raegtin

2

Có rất nhiều lời giải thích dài ở đây mà tôi không có thời gian để đọc chúng. Nhưng tôi nghĩ rằng câu trả lời cho câu hỏi cơ bản có thể ngắn và ngọt ngào. Đó là sự khác biệt giữa một xác suất là vô điều kiện trên dữ liệu. Xác suất 1-alpha trước khi thu thập các dats là xác suất mà quy trình được xác định rõ sẽ bao gồm tham số. Sau khi bạn đã thu thập dữ liệu và biết khoảng thời gian cụ thể mà bạn đã tạo khoảng thời gian là cố định và do đó, vì tham số là hằng số nên xác suất có điều kiện này là 0 hoặc 1. Nhưng vì chúng ta không biết giá trị thực của tham số Sau khi thu thập dữ liệu, chúng tôi không biết đó là giá trị gì.

Gia hạn bài đăng của Michael Chernick sao chép mẫu bình luận:

có một ngoại lệ bệnh lý cho điều này có thể được gọi là ước lượng hoàn hảo. Giả sử chúng ta có một quá trình tự phát theo thứ tự đầu tiên được đưa ra bởi X (n) = pX (n-1) + en. Nó đứng yên nên chúng ta biết p không phải là 1 hoặc -1 và <1 về giá trị tuyệt đối. Bây giờ en được phân phối độc lập với phân phối hỗn hợp có xác suất dương q là en = 0

Có một ngoại lệ bệnh lý cho điều này có thể được gọi là ước lượng hoàn hảo. Giả sử chúng ta có một quá trình tự phát theo thứ tự đầu tiên được đưa ra bởi X (n) = pX (n-1) + en. Nó đứng yên nên chúng ta biết p không phải là 1 hoặc -1 và <1 về giá trị tuyệt đối.

Bây giờ en được phân phối độc lập với phân phối hỗn hợp, có xác suất dương q là en = 0 và với xác suất 1-q, nó có phân phối hoàn toàn liên tục (giả sử rằng mật độ không bằng 0 trong một khoảng giới hạn từ 0. Sau đó thu thập dữ liệu từ chuỗi thời gian một cách tuần tự và cho từng cặp giá trị liên tiếp ước tính p theo X (i) / X (i-1). Bây giờ khi ei = 0 tỷ lệ sẽ chính xác bằng p.

Vì q lớn hơn 0 nên tỷ lệ sẽ lặp lại một giá trị và giá trị đó phải là giá trị chính xác của tham số p bởi vì nếu đó không phải là giá trị của ei thì không 0 sẽ lặp lại với xác suất 0 và ei / x (i -1) sẽ không lặp lại.

Vì vậy, quy tắc dừng tuần tự là lấy mẫu cho đến khi tỷ lệ lặp lại chính xác sau đó sử dụng giá trị lặp lại làm ước tính của p. Vì nó chính xác là bất kỳ khoảng nào bạn xây dựng được tập trung vào ước tính này có xác suất 1 bao gồm tham số thực. Mặc dù đây là một ví dụ bệnh lý không thực tế nhưng vẫn tồn tại các quy trình ngẫu nhiên cố định với các thuộc tính mà chúng tôi yêu cầu để phân phối lỗi


2
thay vào đó, bạn đã xem xét việc nối thêm ví dụ được mô tả qua quá trình một số nhận xét này vào câu trả lời của bạn chưa?
Macro

@Michael Tôi sẽ bình luận thứ hai của Macro. Xin lưu ý rằng các nhận xét thường được coi là một cách để tương tác với người dùng khác (ví dụ: khi yêu cầu làm rõ, v.v.) và trong mọi trường hợp đôi khi được xem là ' công dân hạng ba trong Stack Exchange '. Tuy nhiên, sau khi trao đổi gần đây nhất của chúng tôi, tôi sẽ cho phép bạn quyết định cách tiến hành với loạt ý kiến ​​này. Nhận xét này áp dụng cho một loạt các ý kiến ​​được tìm thấy ở đây .
chl

Tôi không đưa ý kiến ​​vào câu trả lời vì dường như có một chính sách hạ thấp câu trả lời có nhiều cuộc thảo luận trong đó khi ai đó phán xét rằng câu trả lời không thực sự trả lời câu hỏi. Vì vậy, câu trả lời là đưa ra câu trả lời và bình luận dưới ý kiến. Nhận xét của tôi có xu hướng vượt quá giới hạn ký tự nên tôi sử dụng một số.
Michael Chernick

@MichaelCécick Không có chính sách như vậy, do đó tôi đã kết hợp các bình luận của bạn vào bài viết.

1
@MichaelCécick, tôi đã đăng bài trên trang này khá thường xuyên trong khoảng một năm và tôi chưa bao giờ nghe ai đề nghị rằng người điều hành bị áp bức hoặc các quy tắc của trang web gây nhầm lẫn. Các vấn đề mà bạn gặp phải: bài đăng của bạn là những vấn đề được thảo luận rõ ràng trong Câu hỏi thường gặp.
Macro

1

Hai quan sát về nhiều câu hỏi và câu trả lời có thể giúp ích.

Một phần của sự nhầm lẫn xuất phát từ việc làm sáng tỏ một số toán học sâu hơn về lý thuyết xác suất, trong khi đó, không phải là một nền tảng toán học vững chắc cho đến khoảng những năm 1940. Nó đi vào những gì cấu thành không gian mẫu, không gian xác suất, v.v.

Đầu tiên, bạn đã tuyên bố rằng sau khi lật đồng xu, chúng tôi biết rằng có 0% xác suất nó không xuất hiện nếu nó xuất hiện. Tại thời điểm đó, không có ý nghĩa gì khi nói về xác suất; những gì đã xảy ra, và chúng ta biết điều đó. Xác suất là về những điều chưa biết trong tương lai, không phải là điều được biết đến trong hiện tại.

Như một hệ quả tất yếu về ý nghĩa của xác suất 0 thực sự có nghĩa là gì, hãy xem xét điều này: chúng tôi giả sử một số lượng công bằng có xác suất 0,5 đầu sắp tới và 0,5 đuôi sắp tới. Điều này có nghĩa là nó có 100% cơ hội xuất hiện ở đầu hoặc đuôi, vì những kết quả đó là MECE (loại trừ lẫn nhau và hoàn toàn toàn diện). Tuy nhiên, nó có một sự thay đổi không phần trăm trong việc tổng hợp các đầu và đuôi : Quan niệm của chúng tôi về 'đầu' và 'đuôi' là chúng loại trừ lẫn nhau. Do đó, điều này có cơ hội không phần trăm vì không thể theo cách chúng ta nghĩ (hoặc định nghĩa) "tung đồng xu". Và nó là không thể trước và sau khi ném.

Như một hệ quả tất yếu hơn cho điều này, bất cứ điều gì không, theo định nghĩa, không thểcó thể. Trong thế giới thực, tôi ghét khi luật sư hỏi "không phải bạn đã ký vào tài liệu này và quên nó sao?" bởi vì câu trả lời luôn luôn là "có" theo bản chất của câu hỏi. Đối với vấn đề đó, câu trả lời cũng là "có" cho câu hỏi "không phải bạn có thể được vận chuyển thông qua việc phi vật chất hóa đến hành tinh Remulak 4 và buộc phải làm gì đó sau đó được vận chuyển trở lại mà không có ký ức về nó?". Khả năng có thể rất thấp - nhưng điều không thể là không thể. Trong khái niệm xác suất thường xuyên của chúng tôi, khi chúng tôi nói về việc lật một đồng xu, nó có thể xuất hiện; nó có thể đi lên đuôi; và nó thậm chí có thể đứng trên đầu hoặc (bằng cách nào đó, chẳng hạn như nếu chúng ta bị lẻn vào tàu vũ trụ trong khi bị đánh thuốc và đưa lên quỹ đạo) trôi nổi trong không khí mãi mãi. Nhưng, trước hoặc sau khi ném, đuôi cùng một lúc: chúng là kết quả loại trừ lẫn nhau trong không gian mẫu của thí nghiệm (tra cứu 'không gian mẫu xác suất' và 'sigma-algebras').

Thứ hai, trên tất cả các triết lý Bayes / Thường xuyên này về các khoảng tin cậy, đúng là nó liên quan đến tần số nếu một người hoạt động như một người thường xuyên. Vì vậy, khi chúng tôi nói khoảng tin cậy cho giá trị trung bình được lấy mẫu và ước tính là 95%, chúng tôi không nói rằng chúng tôi chắc chắn 95% giá trị 'thực' nằm giữa các giới hạn. Chúng tôi đang nói rằng, nếu chúng ta có thể lặp đi lặp lại thí nghiệm này nhiều lần, 95% thời gian chúng ta sẽ thấy rằng ý nghĩa thực sự là giữa các giới hạn. Tuy nhiên, khi chúng tôi làm điều đó với một lần chạy, chúng tôi đang thực hiện một lối tắt tinh thần và nói rằng 'chúng tôi chắc chắn 95% là chúng tôi đúng'.

Cuối cùng, đừng quên thiết lập tiêu chuẩn trong bài kiểm tra giả thuyết dựa trên một thử nghiệm. Nếu chúng ta muốn biết liệu một loại hormone tăng trưởng thực vật làm cho cây phát triển nhanh hơn, trước tiên chúng ta có thể xác định kích thước trung bình của một quả cà chua sau 6 tháng tăng trưởng. Sau đó, chúng tôi lặp lại, nhưng với hormone, và có được kích thước trung bình. Giả thuyết khống của chúng tôi là "hoóc môn không hoạt động" và chúng tôi kiểm tra điều đó . Nhưng, nếu các nhà máy được thử nghiệm, trung bình lớn hơn, với độ tin cậy 99%, điều đó có nghĩa là 'sẽ luôn có sự thay đổi ngẫu nhiên do các nhà máy và chúng ta cân chính xác như thế nào, nhưng lượng ngẫu nhiên sẽ giải thích điều này sẽ xảy ra ít hơn một thời gian trong một trăm. "


1

Vấn đề có thể được mô tả như một sự nhầm lẫn của xác suất trước và sau hoặc có thể là sự không hài lòng của việc không biết phân phối chung của các biến ngẫu nhiên nhất định.

Điều hòa

n1nXYXYP(X=xY=y)=1/(n(n1))x,yN:={1,,n}xyP(X=x)=1/nP(Y=x)=1/nxN

tP(X=x)=1/nxNxNX=xP(X=x|Y=t)=P(X=xY=t)/P(Y=t)xt1/(n1)x=t0X=xY=tX=xX=xY=tP(X=x)=P(Y=x)=1/nxN

Không điều chỉnh bằng chứng có nghĩa là bỏ qua bằng chứng. Tuy nhiên, chúng ta chỉ có thể dựa vào những gì có thể biểu hiện được trong mô hình xác suất. Trong ví dụ của chúng tôi với hai quả bóng từ chiếc bình, chúng ta không thể dựa vào thời tiết hoặc cảm giác của chúng ta hôm nay. Trong trường hợp chúng tôi có lý do để tin rằng đó là bằng chứng liên quan đến thử nghiệm, trước tiên chúng tôi phải thay đổi mô hình của mình để cho phép chúng tôi thể hiện bằng chứng này dưới dạng sự kiện chính thức.

CC=1X<YP(C=1)=1/2tP(C=1|Y=t)=(t1)/(n1)P(C=1|Y=1)=0C=1P(C=1|Y=n)=1C=1P(C=1)=1/2

Khoảng tin cậy

X=(X1,,Xn)n(l,u)γXluRnθRP(l(X)θu(X))γ

C(l,u)C=1l(X)θu(X)P(C=1)γ

x=(x1,,xn)RnxiXiiC=1δ:=P(C=1|X=x)01(C=1X=x)((l(x)θu(x))X=x)l(x)θu(x)δ=0l(x)θu(x)X=xδ=1l(x)u(x)xδ{0,1}

P(C=1)γC=1x[l(x),u(x)][l(x),u(x)]θγ, có nghĩa là thừa nhận bằng chứng này và đồng thời bỏ qua nó.

Học nhiều hơn, hiểu ít hơn

δXYxRP(X=x)P(Y=x)P(X=xY=y)x,yR(X,Y)

Y=7XP(X=x)x(x,7)xRxP(X=x)Y=7Y=77P(X=x)X=xP(X=x|Y=7)=P(X=xY=7)/P(Y=7)

YX


0

Nếu tôi nói xác suất Knicks ghi được giữa xbar - 2sd (x) và xbar + 2sd (x) là khoảng 0,95 trong một số trò chơi nhất định trong quá khứ, đó là một tuyên bố hợp lý đưa ra một số giả định phân phối cụ thể về phân phối điểm bóng rổ . Nếu tôi thu thập dữ liệu về điểm số được đưa ra một số mẫu trò chơi và tính khoảng thời gian đó, xác suất mà họ ghi được trong khoảng thời gian đó vào một ngày nhất định trong quá khứ rõ ràng là không hoặc một, và bạn có thể google kết quả trò chơi để tìm hiểu. Khái niệm duy nhất về việc nó duy trì khác không hoặc một xác suất đối với người thường xuyên xuất phát từ việc lấy mẫu lặp lại và việc thực hiện ước lượng khoảng của một mẫu cụ thể là điểm kỳ diệu xảy ra hoặc nó không đưa ra ước tính khoảng thời gian của mẫu đó . Đây không phải là điểm mà bạn nhập mật khẩu,

Đây là những gì Dikran lập luận ở trên, và tôi đã bỏ phiếu cho câu trả lời của anh ấy. Điểm khi các mẫu lặp lại không được xem xét là điểm trong mô hình thường xuyên mà xác suất không rời rạc trở nên không thể đạt được , không phải khi bạn nhập mật khẩu như trong ví dụ của bạn ở trên hoặc khi bạn google kết quả trong ví dụ của tôi về Trò chơi Knicks, nhưng điểm khi số lượng mẫu của bạn = 1.


0

Làm người mẫu

S=(Ω,Σ,P)EΣP(E)ESS

Bước (1) có thể cho phép một số thời gian. Sự phù hợp của mô hình đôi khi có thể được kiểm tra bằng cách so sánh xác suất của các sự kiện nhất định với những gì chúng ta mong đợi bằng trực giác. Cụ thể, xem xét các xác suất cận biên hoặc có điều kiện nhất định có thể giúp có được ý tưởng mô hình phù hợp như thế nào.

X1,,XnDist(θ)θR

Ước tính khoảng tin cậy

γLRRnP(L(X)θR(X))γX=(X1,,Xn)L(X)R(X)xRnL(x)θR(x)

Sở thích

γ1γ2γ1<γ2xác suất cao hơn là một vé chiến thắng so với lần đầu tiên khi chúng được rút ra. Một ưu tiên liên quan đến các quan sát khác nhau (hai vé trong ví dụ này) dựa trên các thuộc tính xác suất của các quá trình ngẫu nhiên tạo ra các quan sát là tốt. Lưu ý rằng chúng tôi không nói rằng bất kỳ vé nào có xác suất cao hơn là vé chiến thắng. Nếu chúng ta từng nói như vậy, thì với "xác suất" theo nghĩa thông tục, có thể có nghĩa là bất cứ điều gì, vì vậy tốt nhất nên tránh ở đây.

0.95

Ví dụ với một ưu tiên đơn giản

θP(θ=0)=P(θ=1)=1/2ϑRθ=ϑX1,,XnN(ϑ,1)L,RγϑRP(L(X)ϑR(X)|θ=ϑ)γP(L(X)θR(X))γ

xRn(X1,,Xn)θL(x)R(x)P(L(x)θR(x)|X=x)fμnμσ=1

P(L(x)θR(x)|X=x)={f0(x)f0(x)+f1(x)if L(x)0R(x)<1f1(x)f0(x)+f1(x)if 0<L(x)1R(x)1if L(x)0 and 1R(x)0else
γθL(X)θR(X)γ

θxx{μ0,μ1}={0,1}

P(θ=μ0|X=x)=fμ0(x)fμ0(x)+fμ1(x)

0

Nếu chúng ta có thể nói "xác suất tham số thực nằm trong khoảng tin cậy này" thì chúng ta sẽ không tính đến kích thước của mẫu. Cho dù mẫu có lớn đến đâu, miễn là giá trị trung bình là như nhau, thì khoảng tin cậy sẽ rộng bằng nhau. Nhưng khi chúng tôi nói "nếu tôi lặp lại 100 lần này, thì tôi sẽ hy vọng rằng trong 95 trường hợp, tham số thực sẽ nằm trong khoảng", chúng tôi đang tính đến kích thước của cỡ mẫu và chắc chắn ước tính của chúng tôi là . Kích thước mẫu càng lớn, ước tính trung bình sẽ càng ít. Vì vậy, nó sẽ không thay đổi nhiều như vậy và khi chúng tôi lặp lại quy trình 100 lần, chúng tôi không cần một khoảng lớn để đảm bảo rằng trong 95 trường hợp, tham số thực nằm trong khoảng.


Hãy nhớ rằng khoảng tin cậy là một khái niệm thường xuyên.
Michael Chernick
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.