Chính xác thì khoảng tin cậy là gì?


86

Tôi biết đại khái và không chính thức khoảng tin cậy là gì. Tuy nhiên, tôi dường như không thể quấn đầu quanh một chi tiết khá quan trọng: Theo Wikipedia:

Khoảng tin cậy không dự đoán rằng giá trị thực của tham số có xác suất cụ thể nằm trong khoảng tin cậy được cung cấp cho dữ liệu thực sự thu được.

Tôi cũng đã thấy những điểm tương tự được thực hiện ở một số nơi trên trang web này. Một định nghĩa chính xác hơn, cũng từ Wikipedia, là:

nếu các khoảng tin cậy được xây dựng trên nhiều phân tích dữ liệu riêng biệt của các thử nghiệm lặp lại (và có thể khác nhau), thì tỷ lệ của các khoảng đó có chứa giá trị thực của tham số sẽ xấp xỉ với mức tin cậy

Một lần nữa, tôi đã thấy những điểm tương tự được thực hiện ở một số nơi trên trang web này. Tôi không hiểu Nếu, trong các thử nghiệm lặp đi lặp lại, phần các khoảng tin cậy được tính toán có chứa tham số thực là , thì làm sao xác suất trong khoảng tin cậy được tính cho thử nghiệm thực tế có thể khác với ? Tôi đang tìm kiếm câu trả lời sau đây:( 1 - α ) θ ( 1 - α )θ(1α)θ(1α)

  1. Làm rõ sự khác biệt giữa các định nghĩa không chính xác và đúng ở trên.

  2. Một định nghĩa chính thức, chính xác về khoảng tin cậy cho thấy rõ tại sao định nghĩa đầu tiên sai.

  3. Một ví dụ cụ thể về trường hợp định nghĩa đầu tiên là sai một cách ngoạn mục, ngay cả khi mô hình cơ bản là chính xác.


4
Bài đăng này có một số thảo luận tốt về vấn đề thống kê khoảng tin cậy.stackexchange.com/questions/2356/ . Bài viết được đề cập trong bài viết, tôi nghĩ, giúp làm sáng tỏ một số chính xác lý do tại sao các định nghĩa trên là chính xác cho khoảng tin cậy. Thông thường khi xem các TCTD bị phá vỡ như thế nào thì người ta có thể hiểu chúng tốt hơn.
xác suất

2
Một phần trong tôi hoan nghênh câu hỏi (+1). Một phần cạnh tranh muốn chỉ ra rằng 1. Phần lớn người tiêu dùng thống kê, những người sử dụng số liệu thống kê thực tế nhưng không triết lý để đưa ra quan điểm của họ trong hóa học hoặc nghiên cứu thị trường, sẽ không bao giờ nắm bắt được các vấn đề, và chúng ta sẽ thường bị mất để giải thích kết quả. 2. Ngay cả một số nhà thống kê theo chủ nghĩa thuần túy cũng có thể rơi vào cái bẫy đưa ra các tuyên bố xác suất giống như những tuyên bố liên quan đến khoảng tin cậy khi chúng không hoạt động với các mẫu ngẫu nhiên. Một vấn đề lớn hơn nhiều.
rolando2

3
@Mario Giả định của bạn không đúng! Trong số 100 lần lặp lại của thí nghiệm, chúng tôi hy vọng 95 trong số các TCTD (không phải là phương tiện) có chứa ý nghĩa thực sự (nhưng chưa biết). CI là ngẫu nhiên nhưng ý nghĩa dân số thực sự thì không.
whuber

6
Có một bài báo hay của Cumming & Maillardet (2006) cho thấy rằng không phải 95% phương tiện sao chép sẽ rơi vào CI ban đầu, mà chỉ có 83,4% (họ gọi giá trị này là 'tỷ lệ bắt giữ'). Lý do là có hai nguồn biến thiên: A) độ biến thiên của giá trị trung bình ban đầu xung quanh muvà, B) độ biến thiên của phương tiện sao chép xung quanh mu. Hầu hết mọi người quên A: CI ban đầu không cần thiết được xây dựng xung quanh mu!
Felix S

2
Độc giả quan tâm cũng có thể muốn xem chủ đề này: Tại sao CI 95% không ngụ ý 95% cơ hội chứa giá trị trung bình?
gung

Câu trả lời:


26

Tôi thấy thí nghiệm suy nghĩ này hữu ích khi nghĩ về khoảng tin cậy. Nó cũng trả lời câu hỏi của bạn 3.

Đặt và . Hãy xem xét hai quan sát của lấy các giá trị và tương ứng với các quan sát và của và để và . Sau đó, là một khoảng tin cậy 50% cho (kể từ khoảng thời gian bao gồm nếu hoặc , mỗi trong số đó có khả năng ).Y = X + a - 1XU(0,1)Y=X+a12Yy1y2x1x2Xy u = max ( y 1 , y 2 ) [ y l , y u ] a a x 1 < 1yl=min(y1,y2)yu=max(y1,y2)[yl,yu]aax1>1x1<12<x21x1>12>x214

Tuy nhiên, nếu thì chúng ta biết rằng xác suất khoảng đó chứa là , không phải . Sự tinh tế là khoảng tin cậy cho một tham số có nghĩa là các điểm cuối của khoảng (là biến ngẫu nhiên) nằm ở hai bên của tham số với xác suất trước khi bạn tính khoảng , không phải là xác suất của tham số nằm trong khoảng là sau khi bạn đã tính khoảng . a11yuyl>12a1 z%z%z%12z%z% z%


3
Lưu ý rằng gần như chắc chắn, do đó khoảng chứa tham số có xác suất bằng không. Trong thực tế, đối số của bạn hoạt động nếu những gì bạn đang ước tính là . [ y l , y u ] một θ = một + 1Y>a[yl,yu]aθ=a+12
Đã làm

4
Tôi không nghĩ ví dụ về bộ đếm này là hợp lệ, vì bạn chỉ biết xác suất khoảng đó chứa là một sau khi thấy rằng . Hoàn toàn hợp lý khi xác suất sẽ thay đổi sau khi chúng tôi có được thông tin bổ sung. Nếu tất cả những gì bạn biết là khoảng đó là khoảng tin cậy 50%, thì xác suất sẽ vẫn là 1/2 (mặc dù đó có thể là xác suất Bayes không phải là tần số vì nó áp dụng cho một sự kiện cụ thể không có tần suất chạy dài)y u - y l > 1 / 2θyuyl>1/2
Dikran Marsupial

1
Đó thực sự là một ví dụ tốt, nhưng tôi hoàn toàn không đồng ý với các tuyên bố của bạn về xác suất bằng cách nào đó thay đổi trướcsau khi tính khoảng tin cậy. Điều đó vô nghĩa, và mang lại ấn tượng rằng toán học bằng cách nào đó quan tâm đến những gì bạn biết và những gì bạn không. Nó không !! Bạn luôn có là . Bạn cũng luôn có là . Đó không phải là một mâu thuẫn, một cái chỉ đơn giản là một xác suất vô điều kiện và cái kia là một xác suất có điều kiện. 1P(a[yl,yu]) P(a[yl,yu]121P(a[yl,yu]|yuyl>12)1
fgp

2
@fgp, vâng, có lẽ đó là từ ngữ kém về phần Taylor nói về xác suất thay đổi. Không có xác suất đang thay đổi. Những gì đối số đang thể hiện là việc các tình huống phát sinh dễ dàng như thế nào chứng tỏ sự hiểu lầm về các TCTD dẫn đến các vấn đề logic. Nếu bạn tin rằng một CI bạn quan sát có xác suất đúng 50% nhưng điều đó không thể chính xác thì bạn hiểu về CI là sai.
Giăng

36

Có nhiều vấn đề liên quan đến khoảng tin cậy, nhưng hãy tập trung vào các trích dẫn. Vấn đề nằm ở sự giải thích sai có thể hơn là vấn đề chính xác. Khi mọi người nói "tham số có xác suất cụ thể" là gì đó, họ sẽ nghĩ tham số đó là biến ngẫu nhiên. Đây không phải là quan điểm của thủ tục khoảng tin cậy (cổ điển), trong đó biến ngẫu nhiên là chính khoảng đó và tham số được xác định, không ngẫu nhiên, chưa biết. Đây là lý do tại sao các tuyên bố như vậy thường xuyên bị tấn công.

Về mặt toán học, nếu chúng ta thực hiện bất kỳ thủ tục nào ánh xạ dữ liệu sang các tập hợp con của không gian tham số và nếu (bất kể giá trị của tham số có thể là gì) thì khẳng định định nghĩa một sự kiện , sau đó - theo định nghĩa - nó có xác suất cho bất kỳ giá trị có thể có của . Khi là một thủ tục khoảng tin cậy với độ tin cậy thì xác suất này được cho là có cực tiểu (trên tất cả các giá trị tham số) làx = ( x i ) θ θ t ( x ) A ( x ) Pr θ ( A ( x ) ) θ t 1 - α 1 - αtx=(xi)θθt(x)A(x)Prθ(A(x))θt1α1α. (Theo tiêu chí này, chúng tôi thường chọn các quy trình tối ưu hóa một số thuộc tính bổ sung, chẳng hạn như tạo ra các khoảng tin cậy ngắn hoặc đối xứng, nhưng đó là một vấn đề riêng biệt.) Luật yếu về số lượng lớn sau đó biện minh cho trích dẫn thứ hai. Tuy nhiên, đó không phải là một định nghĩa về khoảng tin cậy: nó chỉ là một tài sản mà họ có.

Tôi nghĩ rằng phân tích này đã trả lời câu hỏi 1, cho thấy tiền đề của câu hỏi 2 là không chính xác và đưa ra câu hỏi 3.


3
Cảm ơn bạn đã cung cấp một câu trả lời cho một câu hỏi xuất sắc. Tôi có thể đưa ra sự tương tự sau đây để thảo luận thêm? Giả sử tôi lật một đồng xu công bằng hơn và hơn. Khi đó, . Bây giờ, tôi lật đồng xu một lần, nhưng không cho bạn thấy những gì tôi đã lật và tôi hỏi: "Xác suất mà các đầu đang lên là gì?". Làm thế nào bạn sẽ trả lời câu hỏi đó? P(Head)=.50
Wolfgang

3
Một cách khác để diễn đạt nó: đối với những người không phải là người Bayes, "những thứ" duy nhất có thể có xác suất là những sự kiện có thể xảy ra - theo nghĩa kết quả trong tương lai của một thử nghiệm ngẫu nhiên. Cho rằng tham số có giá trị đúng cố định, một khi bạn có một khoảng với các giá trị cụ thể, đó không phải là một sự kiện có thể xảy ra nữa cho dù tham số có được bao gồm trong khoảng đó hay không. Kết quả là, bạn có thể tin tưởng vào quá trình tạo ra khoảng, nhưng không phải là hai con số cụ thể.
caracal

1
@caracal - chỉ là một số thực phẩm cho suy nghĩ, là một "lật đồng xu" mỗi thực sự "ngẫu nhiên"? Nếu bạn nói "có" thì bạn sẽ từ chối ý tưởng rằng liệu một đồng xu mọc lên có phải là một hàm xác định (nhưng phức tạp) của nhiều thứ (gió, độ cao, lực và góc lật, trọng lượng của đồng xu, v.v. .). Tôi nghĩ rằng điều này cho thấy tiêu chuẩn kép của "tính ngẫu nhiên" áp dụng cho suy nghĩ dựa trên CI, Dữ liệu được cố định nhưng chúng tôi không chắc chắn về giá trị của nó ( dữ liệu ergo là ngẫu nhiên ), trong khi các tham số là cố định nhưng chúng tôi không chắc chắn về giá trị của nó ( thông số ergo không phải là ngẫu nhiên ).
xác suất

4
@Wolfgang Tôi không thấy ví dụ của bạn liên quan đến khoảng tin cậy. Bạn không yêu cầu bất cứ điều gì liên quan đến một tham số phân phối. Tình huống của bạn liên quan chặt chẽ nhất đến các khoảng dự đoán. Tôi nghĩ rằng toàn bộ cuộc thảo luận này có thể có một số lợi ích trong bối cảnh đó, nhưng nó không thuộc về một chủ đề về khoảng tin cậy.
whuber

2
@whuber Câu hỏi liệu người ta có thể đưa ra tuyên bố xác suất về một CI 95% cụ thể nắm bắt tham số chưa biết thực sự rất giống với câu hỏi liệu người ta có thể đưa ra tuyên bố xác suất về một lần lật cụ thể hay không mà kết quả vẫn chưa được biết. Về lâu dài, 95% các TCTD sẽ nắm bắt được tham số. Về lâu dài, 50% số lần lật là đầu. Chúng ta có thể nói rằng có 95% khả năng một CI cụ thể nắm bắt được tham số không? Chúng ta có thể nói rằng có 50% cơ hội mà đầu lên trước khi nhìn không? Tôi sẽ nói có với cả hai. Nhưng một số người có thể không đồng ý.
Wolfgang

19

Tôi sẽ không gọi định nghĩa về các TCTD là sai, nhưng chúng rất dễ hiểu sai, do có nhiều hơn một định nghĩa về xác suất. Các TCTD được dựa trên định nghĩa Xác suất sau đây (Thường xuyên hoặc bản thể học)

(1) xác suất của một đề xuất = tỷ lệ dài hạn của các lần đề xuất đó được quan sát là đúng, có điều kiện trong quá trình tạo dữ liệu

Do đó, để có giá trị về mặt khái niệm trong việc sử dụng CI, bạn phải chấp nhận định nghĩa xác suất này. Nếu bạn không, thì khoảng thời gian của bạn không phải là CI, theo quan điểm lý thuyết.

Đây là lý do tại sao định nghĩa sử dụng tỷ lệ từ và KHÔNG phải xác suất từ , để làm rõ rằng định nghĩa "tần suất chạy dài" của xác suất đang được sử dụng.

Định nghĩa thay thế chính của Xác suất (Nhận thức luận hoặc xác suất như một phần mở rộng của Logic suy diễn hoặc Bayes) là

(2) xác suất của một mệnh đề = mức độ tin tưởng hợp lý rằng mệnh đề này là đúng, có điều kiện dựa trên trạng thái của kiến ​​thức

Mọi người thường trực giác làm cho cả hai định nghĩa này lẫn lộn và sử dụng bất kỳ cách giải thích nào xảy ra để thu hút trực giác của họ. Điều này có thể đưa bạn vào tất cả các loại tình huống khó hiểu (đặc biệt là khi bạn chuyển từ mô hình này sang mô hình khác).

Rằng hai cách tiếp cận thường dẫn đến cùng một kết quả, có nghĩa là trong một số trường hợp chúng ta có:

Mức độ hợp lý của niềm tin rằng mệnh đề này là đúng, có điều kiện dựa trên trạng thái kiến ​​thức = tỷ lệ dài hạn của thời gian mà mệnh đề được quan sát là đúng, có điều kiện trong quá trình tạo dữ liệu

Vấn đề là nó không giữ được phổ quát , vì vậy chúng ta không thể mong đợi hai định nghĩa khác nhau sẽ luôn dẫn đến cùng một kết quả. Vì vậy, trừ khi bạn thực sự tìm ra giải pháp Bayes, và sau đó thấy nó là cùng một khoảng, bạn không thể đưa ra khoảng thời gian do CI đưa ra để giải thích như một xác suất chứa giá trị thực. Và nếu bạn làm như vậy, thì khoảng đó không phải là Khoảng tin cậy, mà là Khoảng tin cậy.


2
Tôi không thấy lý do tại sao xác suất của một mệnh đề theo định nghĩa 1 phải là một số hữu tỷ. Tỷ lệ dài hạn dường như đề cập đến giới hạn của tỷ lệ số lần sao cho mệnh đề được quan sát là đúng. Mỗi tỷ lệ là một số hữu tỷ nhưng giới hạn của chúng có thể không. (May mắn thay, dấu ngoặc đơn này của bạn có vẻ tiếp tuyến tốt nhất với phần còn lại của câu trả lời của bạn.)
Đã làm

3
@probability Câu trả lời này dường như đang đưa chúng ta đi tiếp tuyến theo một cách không mang tính xây dựng. Xác suất và tỷ lệ tương đương là một dạng nhầm lẫn bản thể, gần giống với việc đánh giá nhiệt độ với mức thủy ngân trong nhiệt kế: một là cấu trúc lý thuyết và hai là hiện tượng vật lý được sử dụng để đo lường nó. Có một số cuộc thảo luận về điều này tại stats.stackexchange.com/questions/1525/ .
whuber

@Didier - trên thực tế, chuỗi của , đó là các điều khoản hợp lý với giới hạn phi lý. Tôi đã loại bỏ nhận xét này. Cảm ơn đã đưa ra vấn đề này. xn=r2xn1+xn12r
xác suất

6
@whuber - Điểm có liên quan để đưa ra bởi vì chính sự hiểu lầm này dẫn đến việc mọi người giải thích các TCTD sai cách. Xác suất nhầm lẫn với "mức độ niềm tin hợp lý" không phù hợp với mô hình thường xuyên. Đây là những gì xảy ra khi bạn lấy các TCTD có nghĩa là "xác suất của giá trị thực nằm trong khoảng", đó là những gì @dsimcha đang làm trong câu hỏi.
xác suất

1
@probability Cảm ơn bạn đã giải thích. Tôi đã hiểu câu trả lời của bạn là phù hợp với định nghĩa "xác suất = tỷ lệ." Trong thực tế, một đọc lại gần gũi vẫn gợi ý đây là những gì bạn đang nói trong đoạn thứ ba, mặc dù nhận xét của bạn bây giờ đặc trưng cho điều này là một sự hiểu lầm. Bạn có thể muốn làm rõ điểm này.
whuber

6

RA Fisher có một tiêu chí về tính hữu ích của các khoảng tin cậy: Một CI không nên thừa nhận "các tập con có thể nhận dạng" ngụ ý một mức độ tin cậy khác nhau. Trong hầu hết (nếu không phải tất cả) các mẫu phản, chúng ta có trường hợp có các tập hợp con có thể xác định được có xác suất bảo hiểm khác nhau.

Trong các trường hợp này, bạn có thể sử dụng các khoảng tín dụng Bayes để xác định ý thức chủ quan về vị trí của tham số hoặc bạn có thể hình thành một khoảng khả năng để phản ánh độ không đảm bảo tương đối trong tham số, được cung cấp dữ liệu.

Ví dụ, một trường hợp có vẻ tương đối mâu thuẫn là khoảng tin cậy bình thường 2 mặt cho trung bình dân số. Giả sử lấy mẫu từ một dân số bình thường với tiêu chuẩn nhất định, 95% CI thừa nhận không có tập hợp con có thể nhận dạng sẽ cung cấp thêm thông tin về tham số. Điều này có thể được nhìn thấy bởi thực tế là giá trị trung bình mẫu là một số liệu thống kê đầy đủ trong hàm khả năng - nghĩa là, hàm khả năng độc lập với các giá trị mẫu riêng lẻ khi chúng ta biết giá trị trung bình của mẫu.

Lý do chúng tôi có bất kỳ sự tin tưởng chủ quan nào đối với CI đối xứng 95% đối với giá trị trung bình bình thường xuất phát ít hơn từ xác suất bảo hiểm đã nêu và hơn nữa từ thực tế là 95% CI đối xứng cho trung bình bình thường là khoảng "khả năng cao nhất", nghĩa là, tất cả các giá trị tham số trong khoảng có khả năng cao hơn bất kỳ giá trị tham số nào ngoài khoảng. Tuy nhiên, vì khả năng không phải là một xác suất (theo nghĩa chính xác dài hạn), nên nó là một tiêu chí chủ quan (cũng như việc sử dụng Bayes trước và khả năng). Tóm lại, có vô số khoảng cho trung bình bình thường có xác suất bao phủ 95%, nhưng chỉ CI đối xứng mới có plausbiltiy trực quan mà chúng ta mong đợi từ ước tính khoảng.

Do đó, tiêu chí của RA Fisher ngụ ý rằng xác suất bảo hiểm chỉ nên tương đương với sự tự tin chủ quan nếu nó không thừa nhận bất kỳ tập hợp con nào trong số các tập hợp con này. Nếu các tập hợp con có mặt, thì xác suất bao phủ sẽ có điều kiện dựa trên các giá trị thực của (các) tham số mô tả tập hợp con. Để có được một khoảng với mức độ tin cậy trực quan, bạn sẽ cần phải đặt khoảng thời gian estiamte trên các số liệu thống kê phụ trợ phù hợp giúp xác định tập hợp con. HOẶC, bạn có thể sử dụng các mô hình phân tán / hỗn hợp, điều này dẫn đến việc diễn giải các tham số là các biến ngẫu nhiên (hay còn gọi là thống kê Bayes) hoặc bạn có thể tính toán khả năng của hồ sơ / điều kiện / cận biên theo khung khả năng. Dù bằng cách nào, bạn đã từ bỏ mọi hy vọng để đưa ra một xác suất khách quan có thể kiểm chứng được là chính xác,

Hi vọng điêu nay co ich.


1
(+1) Một cách để biện minh cho CI bình thường đối xứng là nó giảm thiểu chiều dài dự kiến. Cuối cùng, điều đó chỉ đẩy lùi tính chủ quan đối với sự lựa chọn độ dài như là một hàm mất mát trong một thủ tục quyết định: nhưng đó được cho là một loại chủ quan "tốt" (vì nó thể hiện vai trò của các mục tiêu phân tích của chúng ta trong lựa chọn thủ tục thống kê) chứ không phải là Chủ quan "xấu", nghe có vẻ giống như một số biểu tượng nổi tiếng.
whuber

5

Từ góc độ lý thuyết Câu hỏi 2 và 3 dựa trên giả định không chính xác rằng các định nghĩa sai. Vì vậy, tôi đồng ý với câu trả lời của @ whuber về khía cạnh đó và câu trả lời của @ whuber cho câu hỏi 1 không yêu cầu bất kỳ đầu vào bổ sung nào từ tôi.

Tuy nhiên, từ góc độ thực tế hơn, khoảng tin cậy có thể được đưa ra định nghĩa trực quan của nó (Xác suất chứa giá trị thực) khi nó giống hệt nhau với khoảng tin cậy Bayes dựa trên cùng một thông tin (nghĩa là không có thông tin trước).

Nhưng điều này có phần không phù hợp với người chống Bayes cứng, bởi vì để xác minh các điều kiện để cung cấp cho CI của anh ta cách giải thích mà anh ta muốn đưa ra, họ phải tìm ra giải pháp Bayesian, do đó việc giải thích trực quan tự động nắm giữ!

Ví dụ đơn giản nhất là khoảng tin cậy cho giá trị trung bình bình thường với phương sai đã biết và khoảng tin cậy sau sau .¯ x ± σ Z α / 2 1 - α ¯ x ± σ Z α / 21αx¯±σZα/21αx¯±σZα/2

Tôi không chắc chắn chính xác về các điều kiện, nhưng tôi biết những điều sau đây rất quan trọng đối với việc diễn giải trực quan các TCTD:

1) tồn tại một thống kê Pivot, có phân phối độc lập với các tham số (các pivots chính xác có tồn tại bên ngoài các phân phối bình thường và bình phương không?)

2) không có tham số phiền toái, (ngoại trừ trong trường hợp thống kê Pivotal, đây là một trong số ít cách chính xác để xử lý các tham số phiền toái khi thực hiện TCTD)

3) tồn tại một thống kê đầy đủ cho tham số quan tâm và khoảng tin cậy sử dụng thống kê đủ

4) phân phối lấy mẫu của thống kê đủ và phân phối sau có một số loại đối xứng giữa thống kê đủ và tham số. Trong trường hợp bình thường, phân phối lấy mẫu đối xứng nằm trong trong khi .(L|¯x,σ)~N(¯x,σ(x¯|μ,σ)N(μ,σn)(μ|x¯,σ)N(x¯,σn)

Những điều kiện này thường rất khó tìm, và thường thì nhanh hơn để tìm ra khoảng Bayes và so sánh nó. Một bài tập thú vị cũng có thể là thử và trả lời câu hỏi "vì trước đó CI của tôi cũng là Khoảng tin cậy?" Bạn có thể khám phá một số giả định ẩn về quy trình CI của bạn bằng cách xem xét điều này trước.


1
(+1) Có thực sự có một người như là một "người chống Bayes" không? :-)
whuber

6
@whuber Đây là một . Và đây là một nhà kinh tế lượng học cộng tác với cô ấy về học bổng trong triết học thống kê.
Cyan

1
Cảm ơn! Đó là một chủ đề cực kỳ thú vị trong triết lý xác suất và thống kê mà tôi không biết.
whuber

1
Bạn đã viết sai là thiếu ? x¯±zα/2σnn
qazwsx

3

Đây là điều có thể khó hiểu:

  • nếu trung bình 95% của tất cả các khoảng tin cậy sẽ chứa tham số
  • và tôi có một khoảng tin cậy cụ thể
  • Tại sao xác suất khoảng thời gian này chứa tham số cũng là 95%?

Khoảng tin cậy liên quan đến quy trình lấy mẫu. Nếu bạn lấy nhiều mẫu và tính khoảng tin cậy 95% cho mỗi mẫu, bạn sẽ thấy rằng 95% trong số các khoảng đó có nghĩa là dân số.

Điều này rất hữu ích cho các phòng ban chất lượng công nghiệp. Những kẻ đó lấy nhiều mẫu, và bây giờ họ có niềm tin rằng hầu hết các ước tính của họ sẽ khá gần với thực tế. Họ biết rằng 95% ước tính của họ là khá tốt, nhưng họ không thể nói điều đó về từng ước tính cụ thể.

So sánh điều này với xúc xắc lăn: nếu bạn sẽ tung xúc xắc 600 (công bằng), bạn sẽ ném bao nhiêu 6? Dự đoán tốt nhất của bạn là * 600 = 100.16

Tuy nhiên, nếu bạn đã ném MỘT người chết, thật vô ích khi nói: "Có xác suất 1/6 hoặc 16,6% mà bây giờ tôi đã ném 6". Tại sao? Bởi vì cái chết cho thấy một số 6, hoặc một số hình khác. Bạn đã ném 6, hoặc không. Vậy xác suất là 1 hoặc 0. Xác suất không thể là .16

Khi được hỏi trước khi ném, xác suất ném 6 người với MỘT người chết là bao nhiêu, một người Bayes sẽ trả lời " " (dựa trên thông tin trước: mọi người đều biết rằng một người chết có 6 mặt và cơ hội như nhau rơi vào một trong hai), nhưng một Người thường xuyên sẽ nói "Không có ý tưởng" bởi vì chủ nghĩa thường xuyên chỉ dựa trên dữ liệu, không dựa trên các linh mục hoặc bất kỳ thông tin bên ngoài nào.16

Tương tự như vậy, nếu bạn chỉ có 1 mẫu (như vậy là 1 khoảng tin cậy), bạn không có cách nào để nói khả năng của dân số trong khoảng đó là bao nhiêu. Giá trị trung bình (hoặc bất kỳ tham số nào) có trong đó hoặc không. Xác suất là 1 hoặc 0.

Ngoài ra, không đúng khi các giá trị trong Khoảng tin cậy có nhiều khả năng hơn các giá trị bên ngoài đó. Tôi đã làm một minh họa nhỏ; mọi thứ được đo bằng ° C. Hãy nhớ rằng, nước đóng băng ở 0 ° C và sôi ở 100 ° C.

Trường hợp: trong một hồ nước lạnh, chúng tôi muốn ước tính nhiệt độ của nước chảy bên dưới lớp băng. Chúng tôi đo nhiệt độ ở 100 địa điểm. Đây là dữ liệu của tôi:

  • 0,1 ° C (đo ở 49 địa điểm);
  • 0,2 ° C (cũng ở 49 địa điểm);
  • 0 ° C (. Trong 1 vị trí này là nước chỉ sắp đóng băng);
  • 95 ° C (tại một địa điểm, có một nhà máy đổ nước rất nóng vào hồ).
  • Nhiệt độ trung bình: 1,1 ° C;
  • Độ lệch chuẩn: 1,5 ° C;
  • 95% -CI: (-0,8 ° C ...... + 3.0 ° C).

Nhiệt độ trong khoảng tin cậy này chắc chắn KHÔNG nhiều khả năng hơn nhiệt độ bên ngoài nó. Nhiệt độ trung bình của nước chảy trong hồ này KHÔNG THỂ lạnh hơn 0 ° C, nếu không đó sẽ không phải là nước mà là nước đá. Một phần của khoảng tin cậy này (cụ thể là phần từ -0,8 đến 0) thực sự có xác suất 0% chứa tham số thực.

Tóm lại: khoảng tin cậy là một khái niệm thường xuyên, và do đó dựa trên ý tưởng về các mẫu lặp lại. Nếu nhiều nhà nghiên cứu sẽ lấy mẫu từ hồ này và nếu tất cả các nhà nghiên cứu đó tính toán khoảng tin cậy, thì 95% trong số các khoảng đó sẽ chứa tham số thực. Nhưng đối với một khoảng tin cậy duy nhất, không thể nói khả năng của nó chứa tham số thực như thế nào.


1
Đừng nhầm lẫn thực tế là thống kê thường xuyên không đo lường niềm tin với một người thường xuyên có niềm tin trước đó và cập nhật chúng. Sự khác biệt không phải là liệu người thường xuyên có phải là một thằng ngốc không có kiến ​​thức bên ngoài dữ liệu hay không mà là số liệu thống kê thường xuyên cung cấp các biện pháp trực tiếp của các trạng thái niềm tin. Người thường xuyên phải cập nhật niềm tin của họ dựa trên các bài kiểm tra, các TCTD, v.v. nếu không thì toàn bộ hệ thống của họ không hoạt động vì mọi thứ phụ thuộc vào các quyết định được đưa ra.
John

2

Được rồi, tôi nhận ra rằng khi bạn tính khoảng tin cậy 95% cho một tham số bằng các phương pháp thường xuyên cổ điển, điều đó không có nghĩa là có xác suất 95% rằng tham số nằm trong khoảng đó. Tuy nhiên ... khi bạn tiếp cận vấn đề từ góc độ Bayes và tính khoảng tin cậy 95% cho tham số, bạn sẽ nhận được (giả sử trước đó không có thông tin) chính xác cùng khoảng thời gian bạn sử dụng phương pháp cổ điển. Vì vậy, nếu tôi sử dụng thống kê cổ điển để tính toán khoảng tin cậy 95% cho (nói) giá trị trung bình của một tập dữ liệu, sau đó nó sự thật rằng có một xác suất 95%, thông số nằm trong khoảng thời gian đó.


5
Việc bạn có nhận được kết quả tương tự bằng cách sử dụng khoảng tin cậy thường xuyên và khoảng tin cậy Bayes hay không tùy thuộc vào vấn đề, và đặc biệt là phân phối trước được sử dụng trong phương pháp Bayes. Một điều cũng quan trọng trong toán học và khoa học là khi bạn đúng bạn đúng vì lý do chính xác!
Dikran Marsupial

4
Nếu bạn "sử dụng số liệu thống kê cổ điển để tính khoảng tin cậy 95% cho [một tham số]", thì nếu bạn suy luận nhất quán, việc tham khảo "xác suất tham số nằm trong khoảng đó là vô nghĩa ". Thời điểm bạn đề cập đến xác suất đó, bạn đã thay đổi mô hình thống kê của bạn về tình huống. Trong mô hình mới, trong đó tham số là ngẫu nhiên, việc tính toán CI bằng các phương pháp thường xuyên là không chính xác. Có được câu trả lời đúng theo cách này trong một số tình huống là điều thú vị nhưng không biện minh cho sự nhầm lẫn về khái niệm làm cơ sở cho nó.
whuber

4
@whuber - tiền đề của bạn "... nếu bạn lý luận nhất quán ..." có một hệ quả từ định lý Cox cũ tốt. Nó nói rằng nếu bạn đang suy luận một cách nhất quán, thì giải pháp của bạn phải tương đương về mặt toán học với giải pháp Bayes. Vì vậy, với tiền đề này, một CI nhất thiết sẽ tương đương với một khoảng tin cậy và cách giải thích của nó là xác suất là hợp lệ. Và trong Bayes, nó không phải là tham số có phân phối, đó là sự không chắc chắn về tham số có phân phối.
xác suất

2
... tiếp tục ... Vì vậy, người ta có thể chơi trò chơi ngớ ngẩn của tôi là một người Bayes ..., Tôi là người thường xuyên, ..., Tôi là người Bayes ..., tôi là người thường xuyên, ..... tất cả các con số của phép tính thực tế không bao giờ thay đổi
xác suất

2

Bạn đang hỏi về khoảng tin cậy thường xuyên . Định nghĩa (lưu ý rằng không có trích dẫn nào trong số 2 trích dẫn của bạn là định nghĩa! Chỉ cần các câu, cả hai đều đúng) là:

Nếu tôi đã lặp lại thí nghiệm này một số lần lớn, với mô hình được trang bị này với các giá trị tham số này , thì trong 95% thí nghiệm, giá trị ước tính của một tham số sẽ nằm trong khoảng này.

Vì vậy, bạn có một mô hình (được xây dựng bằng cách sử dụng dữ liệu quan sát của bạn) và các tham số ước tính của nó. Sau đó, nếu bạn tạo một số tập dữ liệu giả định theo mô hình và tham số này, các tham số ước tính sẽ nằm trong khoảng tin cậy.

Vì vậy, trên thực tế, cách tiếp cận thường xuyên này lấy mô hình và các tham số ước tính là cố định, như đã cho và coi dữ liệu của bạn là không chắc chắn - như một mẫu ngẫu nhiên của nhiều dữ liệu có thể khác.

Đây thực sự là khó để giải thích và điều này thường được sử dụng như một tham số cho các thống kê Bayes ( mà tôi nghĩ có thể đôi khi hơi mơ hồ . Số liệu thống kê Bayes mặt khác mất dữ liệu của bạn là cố định và xử lý các thông số như chắc chắn. Các Bayes khoảng tin cậy là sau đó thực sự trực quan, như bạn mong đợi: các khoảng tin cậy của Bayes là các khoảng trong đó với 95% giá trị tham số thực nằm.

Nhưng trong thực tế, nhiều người giải thích các khoảng tin cậy thường xuyên theo cách tương tự như các khoảng tin cậy của Bayes và nhiều nhà thống kê không coi đây là một vấn đề lớn - mặc dù họ đều biết, nó không đúng 100%. Cũng trong thực tế, khoảng tin cậy / khoảng tin cậy thường xuyên và không đáng tin cậy sẽ không khác nhau nhiều, khi sử dụng các linh mục không thông tin bayesian .


-1 "định nghĩa" của bạn dường như không chính xác, ít nhất là trong một lần đọc nó. Các CI được xây dựng để che đúng thông số với xác suất . Nó không có điều kiện trên một mô hình cụ thể hoặc phương pháp phù hợp với các tham số. Có lẽ tôi đang đọc sai định nghĩa, mặc dù: Tôi lấy "mô hình được trang bị với giá trị tham số này" để tham khảo ước tính hiện tại của bạn về tham số. Nếu đó không phải là cách bạn dự định, có lẽ bạn có thể làm rõ điểm này? 1α1α
whuber

@whuber, OK, tôi hiểu, nhưng nếu bạn nói definiton của tôi là sai, xin vui lòng gửi định nghĩa đầy đủ của bạn về CI là gì.
Tò mò

Tôi đã làm rõ nhận xét của tôi, Tomas, bởi vì nó xảy ra với tôi Tôi có thể đang đọc định nghĩa của bạn theo cách bạn không có ý định. Kiefer, Giới thiệu về suy luận thống kê , viết "[T] kết quả của thí nghiệm là ... [S] đưa ra quy trình được sử dụng để ước tính và giá trị thực của là ... [T] anh số lượng .. .Công số được gọi là hệ số tín nhiệm của thủ tục ... được gọi là mộtXt=[L,U]ϕ(θ)θθ0γt(θ0)=Prθ0{L(X)ϕ(θ0)U(X)}γ¯t=infθΩγt(θ)ttkhoảng tin cậy. "
whuber

@whuber, định nghĩa của bạn thực sự không thể hiểu đối với tôi và tôi cũng sợ đối với hầu hết mọi người :) Và vâng, ý tôi là ước tính hiện tại, vì người thường xuyên lấy ước tính tham số là ngẫu nhiên và ngược lại với dữ liệu.
Tò mò

3
Tôi nghĩ rằng vấn đề chính trong định nghĩa của bạn Tò mò là, "... giá trị ước tính của một tham số sẽ nằm trong khoảng." Nó không phải là một tham số ước tính mà là một tham số cố định không xác định; và nó không nằm trong khoảng, thay vào đó khoảng thời gian di chuyển xung quanh và 95% thời gian nắm bắt tham số.
Giăng

2

Giả sử chúng ta đang ở trong một tình huống đơn giản. Bạn có một tham số không xác định và một công cụ ước tính của có độ chính xác khoảng 1 (không chính thức). Bạn nghĩ (không chính thức) nên ở thường xuyên nhất.θTθθ[T1;T+1]

Trong một thí nghiệm thực tế, bạn quan sát .T=12

Thật tự nhiên khi đặt câu hỏi "Đưa ra những gì tôi thấy ( ), xác suất gì?". Về mặt toán học: . Mọi người tự nhiên hỏi câu hỏi này. Lý thuyết khoảng tin cậy sẽ trả lời một cách hợp lý cho câu hỏi này. Nhưng nó không.T=12θ[11;13]P(θ[11;13]|T=12)

Thống kê Bayes làm câu trả lời cho câu hỏi đó. Trong thống kê Bayes, bạn thực sự có thể tính . Nhưng bạn cần phải giả định một trước đó là một bản phân phối cho trước khi làm thí nghiệm và quan sát . Ví dụ :P(θ[11;13]|T=12)θT

  • Giả sử có đồng phục phân phối trước trênθ[0;30]
  • làm thí nghiệm này, tìmT=12
  • Áp dụng công thức Bayes:P(θ[11;13]|T=12)=0.94

Nhưng trong thống kê thường xuyên, không có trước và do đó, mọi thứ như không tồn tại. Thay vào đó, các nhà thống kê nói điều gì đó như thế này: "Dù là gì, xác suất là ". Về mặt toán học: "P(θ...|T...)θθ[T1;T+1]0.95θ,P(θ[T1;T+1]|θ)=0.95

Vì thế :

  • Bayes: choT = 12P(θ[T1;T+1]|T)=0.94T=12
  • Người thường xuyên:θ,P(θ[T1;T+1]|θ)=0.95

Tuyên bố Bayes là tự nhiên hơn. Thông thường, tuyên bố thường xuyên bị hiểu sai một cách tự nhiên như tuyên bố Bayes (bởi bất kỳ bộ não người bình thường nào đã không thực hành thống kê trong nhiều năm). Và thành thật mà nói, nhiều cuốn sách thống kê không làm cho điểm đó rất rõ ràng.

Và thực tế?

Trong nhiều tình huống thông thường, thực tế là xác suất thu được từ các phương pháp tiếp cận thường xuyên và Bayes rất gần nhau. Vì vậy, điều khó hiểu đó là tuyên bố thường xuyên cho người Bayes có rất ít hậu quả. Nhưng "về mặt triết học" thì nó rất khác.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.