Khoảng tin cậy hẹp - độ chính xác cao hơn?


17

Tôi có hai câu hỏi về khoảng tin cậy:

Rõ ràng một khoảng tin cậy hẹp ngụ ý rằng có một cơ hội nhỏ hơn để có được một quan sát trong khoảng đó, do đó, độ chính xác của chúng tôi cao hơn.

Ngoài ra, khoảng tin cậy 95% hẹp hơn khoảng tin cậy 99% rộng hơn.

Khoảng tin cậy 99% chính xác hơn 95%.

Ai đó có thể đưa ra một lời giải thích đơn giản có thể giúp tôi hiểu sự khác biệt này giữa độ chính xác và hẹp không?


2
Tôi nghĩ bạn có nghĩa là "có một cơ hội nhỏ hơn để có được một quan sát bên ngoài khoảng đó". Thật không may, Khoảng tin cậy có thể không có nghĩa là gì, do các vấn đề kỹ thuật, thống kê, nhưng nói chung, khoảng hẹp hơn (ở một mức độ tin cậy nhất định) về kết quả không chắc chắn hơn. Có rất nhiều chủ đề trên trang web này thảo luận về ý nghĩa của Khoảng tin cậy (trái ngược với, khoảng thời gian đáng tin cậy). Chúng ta thậm chí không tham gia vào các khoảng dự đoán ...
Wayne

@Wayne Tại sao tuyên bố không phải là "có cơ hội nhỏ hơn để có được một quan sát trong khoảng đó"? Vì khoảng hẹp có lỗi loại 1 lớn, nên nhiều khả năng bác bỏ giả thuyết null thực sự , nghĩa là, giá trị null thực sự của tôi không có trong khoảng đó. Vì vậy, dường như với tôi a narrow confidence interval implies that there is a smaller chance of obtaining an observation within that intervallà chính xác. Bạn vui lòng giải thích cho tôi tôi đang làm sai ở đâu?
người dùng 31466

Câu trả lời:


18

95% hoàn toàn không được đính kèm về mặt số lượng để bạn tự tin rằng bạn đã bao quát được hiệu quả thực sự trong thử nghiệm của mình. Có lẽ nhận ra rằng "khoảng cách sử dụng tính toán phạm vi bao phủ 95%" có thể là một tên chính xác hơn cho nó. Bạn có thể đưa ra lựa chọn để quyết định rằng khoảng chứa giá trị thực; và bạn sẽ đúng nếu bạn làm điều đó một cách nhất quán 95% thời gian. Nhưng bạn thực sự không biết khả năng của thí nghiệm cụ thể của bạn như thế nào nếu không có thêm thông tin.

Q1: Truy vấn đầu tiên của bạn kết hợp hai điều và sử dụng sai một thuật ngữ. Không có gì ngạc nhiên khi bạn bối rối. Khoảng tin cậy hẹp hơn có thể chính xác hơn, nhưng khi được tính theo cùng một cách, chẳng hạn như phương pháp 95%, tất cả chúng đều có cùng độ chính xác. Họ nắm bắt giá trị thực cùng tỷ lệ của thời gian.

Ngoài ra, chỉ vì nó hẹp không có nghĩa là bạn sẽ ít gặp phải một mẫu nằm trong khoảng tin cậy hẹp đó. Một khoảng tin cậy hẹp có thể đạt được một trong ba cách. Phương pháp thử nghiệm hoặc bản chất của dữ liệu có thể có phương sai rất thấp. Khoảng tin cậy xung quanh điểm sôi của nước máy ở mực nước biển là khá nhỏ, bất kể cỡ mẫu. Khoảng tin cậy xung quanh trọng lượng trung bình của mọi người có thể khá lớn bởi vì mọi người rất khác nhau nhưng người ta có thể làm cho khoảng tin cậy đó nhỏ hơn bằng cách thu được nhiều quan sát hơn. Trong trường hợp đó, khi bạn có được sự chắc chắn hơn về nơi bạn tin rằng giá trị thực sự, bằng cách thu thập nhiều mẫu hơn và tạo khoảng tin cậy hẹp hơn, sau đó xác suất gặp một cá nhân trong khoảng tin cậy đó sẽ giảm xuống. (nó sẽ giảm trong mọi trường hợp khi bạn tăng kích thước mẫu, nhưng bạn có thể không bận tâm đến việc thu thập mẫu lớn trong trường hợp nước sôi). Cuối cùng, nó có thể hẹp vì mẫu của bạn không có tính đại diện. Trong trường hợp đó, bạn thực sự có nhiều khả năng có một trong 5% các khoảng không chứa giá trị thực. Đó là một chút nghịch lý liên quan đến chiều rộng CI và một cái gì đó bạn nên kiểm tra bằng cách biết tài liệu và mức độ biến đổi của dữ liệu này. Trong trường hợp đó, bạn thực sự có nhiều khả năng có một trong 5% các khoảng không chứa giá trị thực. Đó là một chút nghịch lý liên quan đến chiều rộng CI và một cái gì đó bạn nên kiểm tra bằng cách biết tài liệu và mức độ biến đổi của dữ liệu này. Trong trường hợp đó, bạn thực sự có nhiều khả năng có một trong 5% các khoảng không chứa giá trị thực. Đó là một chút nghịch lý liên quan đến chiều rộng CI và một cái gì đó bạn nên kiểm tra bằng cách biết tài liệu và mức độ biến đổi của dữ liệu này.

Xem xét thêm rằng khoảng tin cậy là về việc cố gắng ước tính giá trị trung bình thực của dân số. Nếu bạn biết rằng điểm đó sẽ chính xác hơn (và chính xác) và thậm chí không có phạm vi ước tính. Nhưng xác suất bạn gặp phải một quan sát có cùng giá trị chính xác đó sẽ thấp hơn nhiều so với việc tìm thấy một quan sát trong bất kỳ CI dựa trên mẫu cụ thể nào.

Q2 : Khoảng tin cậy 99% rộng hơn 95%. Do đó, nhiều khả năng nó sẽ chứa giá trị thực. Xem sự khác biệt ở trên giữa chính xác và chính xác, bạn đang kết hợp cả hai. Nếu tôi làm cho khoảng tin cậy hẹp hơn với độ biến thiên thấp hơn và cỡ mẫu cao hơn thì nó trở nên chính xác hơn, các giá trị có khả năng bao phủ phạm vi nhỏ hơn. Nếu tôi tăng phạm vi bảo hiểm bằng cách sử dụng phép tính 99% thì nó trở nên chính xác hơn, giá trị thực có nhiều khả năng nằm trong phạm vi.


2
Độ biến thiên của giá trị trung bình (= những gì bạn đang cố ước tính) trong dân số bằng không.
Nick Sabbe

10

Đối với một tập dữ liệu nhất định, việc tăng mức độ tin cậy của khoảng tin cậy sẽ chỉ dẫn đến các khoảng lớn hơn (hoặc ít nhất là không nhỏ hơn ). Đó không phải là về độ chính xác hay độ chính xác mà là về mức độ rủi ro mà bạn sẵn sàng chấp nhận khi thiếu giá trị thực.

Nếu bạn đang so sánh các khoảng tin cậy cho cùng một loại tham số từ nhiều bộ dữ liệu và một tham số nhỏ hơn các tham số khác, bạn có thể nói rằng nhỏ hơn chính xác hơn . Tôi thích nói về độ chính xác hơn là độ chính xác trong tình huống này (xem bài viết Wikipedia có liên quan này ).


"Cùng một loại tham số" và "nhiều bộ dữ liệu" nghĩa là gì? Nói, một cuộc khảo sát về nạn mù chữ và cuộc khảo sát được thực hiện trong các thời điểm khác nhau, 1995, 1998, v.v. Sau đó, "tỷ lệ mù chữ" có cùng loại tham số không và các tập dữ liệu của 1995, 1998, v.v có chỉ ra nhiều tập dữ liệu không?
người dùng 31466

Ví dụ: một tập hợp các khoảng tin cậy, mỗi khoảng cho trung bình của một số dân. Ví dụ của bạn phù hợp, quá, tôi nghĩ.
Karl

3

Trước hết, một CI cho một tỷ lệ tin cậy nhất định (ví dụ 95%) có nghĩa là, cho tất cả các mục đích thực tế (mặc dù về mặt kỹ thuật là không chính xác) rằng bạn tự tin rằng giá trị thực nằm trong khoảng.

Nếu đây là khoảng "hẹp" (lưu ý rằng điều này chỉ có thể được xem xét theo kiểu tương đối, vì vậy, để so sánh với những gì sau đây, hãy nói rằng nó rộng 1 đơn vị), điều đó có nghĩa là không có nhiều chỗ để chơi: giá trị nào bạn chọn trong khoảng đó sẽ gần với giá trị thực (vì khoảng này hẹp) và bạn khá chắc chắn về điều đó (95%).

So sánh giá trị này với CI 95% tương đối rộng (để khớp với ví dụ trước, giả sử nó rộng 100 đơn vị): ở đây, bạn vẫn chắc chắn 95% rằng giá trị thực sẽ nằm trong khoảng này, nhưng điều đó không cho bạn biết nhiều, vì có tương đối nhiều giá trị trong khoảng (khoảng 100 nhân tố so với 1 - và tôi yêu cầu, một lần nữa, những người theo chủ nghĩa thuần túy bỏ qua việc đơn giản hóa).

Thông thường, bạn sẽ cần một khoảng lớn hơn khi bạn muốn chắc chắn 99% rằng giá trị thực nằm trong đó, so với khi bạn chỉ cần chắc chắn 95% (lưu ý: điều này có thể không đúng nếu các khoảng không được lồng ), vì vậy, thực sự, bạn càng cần sự tự tin, khoảng cách bạn sẽ cần chọn càng rộng.

Mặt khác, bạn chắc chắn hơn với khoảng tin cậy cao hơn. Vì vậy, nếu tôi cung cấp cho bạn 2 khoảng có cùng chiều rộng và tôi nói một khoảng là 95% CI và cái kia là 99% CI, tôi hy vọng bạn sẽ thích 99% hơn. Theo nghĩa này, 99% TCTD chính xác hơn: bạn ít nghi ngờ rằng bạn sẽ bỏ lỡ sự thật.


cảm ơn! Vì vậy, khi họ nói rằng nghiên cứu mới này về neutrino nhanh hơn ánh sáng có khoảng tin cậy rất nhỏ (tôi đoán điều này có nghĩa là hẹp) thì điều đó có nghĩa là chúng có nhiều khả năng chính xác hơn nếu đó là khoảng tin cậy rộng? (bỏ qua tất cả các khía cạnh khác)
upabove

10
Nick, tuyên bố đầu tiên của bạn là sai. Đó không phải là "vấn đề kỹ thuật", nó chỉ không chính xác. Khoảng tin cậy là một tuyên bố về những gì sẽ xảy ra trong các thí nghiệm lặp đi lặp lại, rằng chúng sẽ bao gồm giá trị thực 95% thời gian. Một tuyên bố về sự tự tin rằng giá trị thực nằm trong phạm vi nhất định của tôi được tìm thấy trong thử nghiệm đã cho của tôi hoàn toàn không giống với điều đó. Nếu bạn loại bỏ "cái đó" trong "sự tự tin đó" và số lượng chính xác thì bạn sẽ gần với sự thật hơn. Bạn chỉ có thể nói rằng nó có nghĩa là bạn tin rằng giá trị thực có khả năng giảm trong khoảng.
Giăng

mặt khác, câu trả lời là khá tốt ...
John

4
@ John: Tôi đặc biệt tránh nói rằng chính khoảng đó là biến ngẫu nhiên, mặc dù câu của tôi không ngụ ý nó không tồn tại (phải thừa nhận, nó không gợi ý như vậy). Tôi biết các vấn đề liên quan, nhưng thấy chúng không liên quan đến câu hỏi. Tôi chưa bao giờ thấy một tình huống thực tế trong đó sự khác biệt quan trọng, do đó "cho tất cả các mục đích thực tế".
Nick Sabbe

4
Không gặp phải vấn đề? Điều đó giống như nói giá trị p = xác suất của null và sau đó nói rằng bạn chưa bao giờ gặp phải vấn đề nào với nó. Bạn sẽ không nếu bạn ở trong các tạp chí đúng. Thật không đúng khi nói rằng bạn chắc chắn 95% giá trị thực nằm trong phạm vi hiện tại của bạn. Đối xử với nó như một số vấn đề bí truyền chỉ có nghĩa là bây giờ chúng ta sẽ có (ít nhất) một người nữa đi bộ nói rằng: "Tôi tin tưởng 95% giá trị nằm trong phạm vi này." Nó sẽ khó thay đổi câu trả lời của bạn để sửa nó. Các vấn đề khác bạn mặc váy có thể bị bỏ qua nếu bạn thay đổi một tuyên bố đó.
Giăng

3

Tôi đang thêm vào một số câu trả lời tốt ở đây mà tôi đã đưa ra. Tôi nghĩ rằng có một chút nữa nên được nói để hoàn toàn làm sáng tỏ kết luận. Tôi thích các thuật ngữ chính xác và chính xác như Efron định nghĩa chúng. Tôi đã đưa ra một cuộc thảo luận dài về điều này rất gần đây về một câu hỏi khác. Whuber vừa phải thực sự thích câu trả lời đó. Tôi sẽ không đi đến cùng một thứ để lặp lại điều đó ở đây. Tuy nhiên, độ chính xác của Efron liên quan đến mức độ tin cậy và độ chính xác đối với độ rộng hoặc độ kín của khoảng. Nhưng bạn không thể nói về độ kín mà không xem xét độ chính xác trước. Một số khoảng tin cậy là chính xác là chính xác bởi vì chúng có phạm vi bảo hiểm thực tế mà họ quảng cáo. Khoảng tin cậy 95% cũng có thể gần đúng vì nó sử dụng phân phối tiệm cận. Khoảng thời gian gần đúng dựa trên tiệm cận là đối với cỡ mẫu hữu hạn n sẽ không có phạm vi bảo hiểm được quảng cáo là phạm vi bảo hiểm bạn sẽ nhận được nếu phân phối tiệm cận là phân phối chính xác. Vì vậy, một khoảng gần đúng có thể được bảo mật (tức là quảng cáo 95% khi phạm vi bảo hiểm thực tế của nó chỉ là 91%) hoặc trong trường hợp bảo hiểm hiếm gặp nhưng ít nghiêm trọng hơn (nghĩa là bảo hiểm được quảng cáo là 95% nhưng thực tế là 98%). Trong trường hợp trước đây, chúng tôi lo lắng về mức độ bao phủ thực tế gần với phạm vi bảo hiểm được quảng cáo). Một thước đo độ gần là thứ tự chính xác có thể nói là 1 / √n hoặc 1 / n. Nếu mức độ tin cậy thực tế gần, chúng tôi gọi nó là chính xác. Accuray rất quan trọng với khoảng tin cậy của bootstrap không bao giờ chính xác nhưng một số biến thể chính xác hơn các biến thể khác.

Định nghĩa về độ chính xác này có thể khác với định nghĩa mà OP đang đề cập nhưng hiện tại cần phải rõ định nghĩa của Efron là gì và tại sao điều quan trọng là phải chính xác. Bây giờ nếu bạn có hai phương thức chính xác, chúng ta có thể thích phương thức này hơn phương pháp khác nếu với bất kỳ mức độ tin cậy nào, nó có chiều rộng dự kiến ​​nhỏ hơn. Khoảng tin cậy là tốt nhất theo nghĩa này (đôi khi được gọi là ngắn nhất) sẽ là lựa chọn. Nhưng điều này đòi hỏi sự chính xác. Nếu mức độ tin cậy chỉ là gần đúng, chúng ta có thể so sánh táo và cam. Người ta có thể hẹp hơn người khác chỉ vì nó kém chính xác hơn và do đó có phạm vi bảo hiểm thực tế thấp hơn phạm vi bảo hiểm được quảng cáo.

Nếu hai khoảng tin cậy đều rất chính xác hoặc một là chính xác và cái kia rất chính xác so sánh chiều rộng dự kiến ​​có thể ổn vì ít nhất bây giờ chúng ta đang xem xét chỉ hai hai giống táo.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.