Ví dụ về khi khoảng tin cậy và khoảng tin cậy trùng nhau


11

Trong bài viết trên wikipedia về Khoảng tin cậy , nó viết:

Đối với trường hợp một tham số và dữ liệu có thể được tóm tắt trong một thống kê đủ duy nhất, có thể chỉ ra rằng khoảng tin cậy và khoảng tin cậy sẽ trùng khớp nếu tham số chưa biết là tham số vị trí (nghĩa là hàm xác suất chuyển tiếp có dạng Pr (x | μ) = f (x - μ)), với ưu tiên là phân phối phẳng đồng đều; [5] và nếu tham số chưa biết là tham số tỷ lệ (nghĩa là hàm xác suất chuyển tiếp có dạng Pr (x | s) = f (x / s)), với trước [5] của Jeffreys - cái sau bởi vì lấy logarit của tham số tỷ lệ như vậy biến nó thành tham số vị trí với phân bố đồng đều. Nhưng đây là những trường hợp đặc biệt (mặc dù quan trọng); nói chung không có sự tương đương nào có thể được thực hiện. "

Mọi người có thể cho ví dụ cụ thể về điều này? Khi nào thì 95% CI thực sự tương ứng với "95% cơ hội", do đó "vi phạm" định nghĩa chung về CI?

Câu trả lời:


13

phân phối bình thường:

Hãy phân phối bình thường với phương sai đã biết. Chúng ta có thể lấy phương sai này là 1 mà không mất tính tổng quát (bằng cách chia mỗi quan sát cho căn bậc hai của phương sai). Điều này có phân phối mẫu:

p(X1...XN|μ)=(2π)N2exp(12i=1N(Xiμ)2)=Aexp(N2(X¯μ)2)

Trong đó là hằng số chỉ phụ thuộc vào dữ liệu. Điều này cho thấy trung bình mẫu là một thống kê đầy đủ cho trung bình dân số. Nếu chúng tôi sử dụng đồng phục trước, thì phân phối sau cho sẽ là:Aμ

(μ|X1...XN)Normal(X¯,1N)(N(μX¯)|X1...XN)Normal(0,1)

Vì vậy, khoảng tin cậy sẽ có dạng:1α

(X¯+1NLα,X¯+1NUα)

Trong đó và được chọn sao cho biến ngẫu nhiên chuẩn thông thường thỏa mãn:LαUαZ

Pr(Lα<Z<Uα)=1α

Bây giờ chúng ta có thể bắt đầu từ "số lượng quan trọng" này để xây dựng khoảng tin cậy. Phân phối lấy mẫu của cho cố định là phân phối chuẩn thông thường, vì vậy chúng ta có thể thay thế điều này vào xác suất trên:N(μX¯)μ

Pr(Lα<N(μX¯)<Uα)=1α

Sau đó sắp xếp lại để giải quyết cho và khoảng tin cậy sẽ giống như khoảng tin cậy.μ

Thông số tỷ lệ:

Đối với tham số tỷ lệ, pdf có dạng . Chúng ta có thể lấy , tương ứng với . Phân phối lấy mẫu chung là:p(Xi|s)=1sf(Xis)(Xi|s)Uniform(0,s)f(t)=1

p(X1...XN|s)=sN0<X1...XN<s

Từ đó chúng tôi tìm thấy số liệu thống kê đủ bằng (mức tối đa của các quan sát). Bây giờ chúng tôi tìm thấy phân phối mẫu của nó:Xmax

Pr(Xmax<y|s)=Pr(X1<y,X2<y...XN<y|s)=(ys)N

Bây giờ chúng ta có thể làm cho điều này độc lập với tham số bằng cách lấy . Điều này có nghĩa là "số lượng pivotal" của chúng tôi được đưa ra bởi với là phân phối . Vì vậy, chúng ta có thể chọn bằng cách sử dụng các lượng tử beta sao cho:y=qsQ=s1XmaxPr(Q<q)=qNbeta(N,1)Lα,Uα

Pr(Lα<Q<Uα)=1α=UαNLαN

Và chúng tôi thay thế số lượng quan trọng:

Pr(Lα<s1Xmax<Uα)=1α=Pr(XmaxLα1>s>XmaxUα1)

Và có khoảng tin cậy của chúng tôi. Đối với giải pháp Bayes với jeffreys trước chúng ta có:

p(s|X1...XN)=sN1XmaxrN1dr=N(Xmax)NsN1
Pr(s>t|X1...XN)=N(Xmax)NtsN1ds=(Xmaxt)N

Bây giờ chúng tôi cắm vào khoảng tin cậy và tính toán độ tin cậy của nó

Pr(XmaxLα1>s>XmaxUα1|X1...XN)=(XmaxXmaxUα1)N(XmaxXmaxLα1)N

=UαNLαN=Pr(Lα<Q<Uα)

Và uy tín , chúng tôi có độ tin cậy và bảo hiểm .1α


Một kiệt tác, cảm ơn! Tôi đã hy vọng rằng có thể có một câu trả lời như "khi tính giá trị trung bình của mẫu từ phân phối chuẩn, CI 95% thực sự cũng là Khoảng tin cậy 95%" hoặc một cái gì đó đơn giản như thế. (Chỉ cần đưa ra câu trả lời được cho là này, tôi không có manh mối nào về các ví dụ cụ thể.)
Wayne

Tôi tin rằng khoảng dự đoán / dung sai 95% thường xuyên tương ứng với khoảng dự đoán Bayes với hồi quy OLS và các lỗi thông thường. Dù sao nó cũng xuất hiện khi tôi so sánh câu trả lời của dự đoán với câu trả lời mô phỏng. Điều đó có đúng không?
Wayne

Đối với , Nếu bạn sử dụng đồng phục trước cho và jeffreys trước cho , thì bạn có sự tương đương. Y=α+βXα,βσ
xác suất

Cảm ơn rất nhiều! Tôi đã cố gắng giải thích một CI về hồi quy Tôi đã thực hiện theo Khoảng tin cậy và đơn giản là nó không kết nối với khán giả giáo dân, họ mong đợi một Khoảng đáng tin cậy. Làm cho cuộc sống của tôi dễ dàng hơn nhiều ... mặc dù có lẽ nó tệ cho thế giới thống kê nói chung, vì nó sẽ củng cố sự hiểu lầm của giáo dân về CI.
Wayne

@Wayne - tình hình chung chung hơn một chút so với chỉ các gia đình quy mô địa điểm. Thông thường, một CI sẽ tương đương với khoảng tin cậy, nếu nó dựa trên một "thống kê đầy đủ" (như hai điều này) khi điều này tồn tại. Nếu không có đủ số liệu thống kê, thì CI cần phải dựa vào cái gọi là "thống kê phụ trợ" để có giải thích khoảng tin cậy.
xác suất
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.