Có cách nào hữu ích để xác định khoảng tin cậy của người giỏi nhất không?


8

Định nghĩa chuẩn của (giả sử) khoảng tin cậy (CI) 95% chỉ đơn giản yêu cầu xác suất chứa thông số thực là 95%. Rõ ràng, điều này không phải là duy nhất. Các ngôn ngữ tôi đã nhìn thấy gợi ý rằng trong số nhiều CI hợp lệ, nó thường làm cho tinh thần để tìm một cái gì đó giống như ngắn nhất, hoặc đối xứng, hoặc được biết một cách chính xác ngay cả khi một số thông số phân phối là không rõ, vv Nói cách khác, có vẻ là không có hệ thống phân cấp rõ ràng về những gì CI "tốt hơn" so với những người khác.

Tuy nhiên, tôi nghĩ một định nghĩa tương đương của CI là nó bao gồm tất cả các giá trị sao cho giả thuyết null cho rằng tham số thực bằng với giá trị đó sẽ không bị từ chối ở mức ý nghĩa phù hợp sau khi xem mẫu nhận ra. Điều này cho thấy miễn là chúng tôi chọn một bài kiểm tra mà chúng tôi thích, chúng tôi có thể tự động xây dựng CI. Và có một ưu tiên tiêu chuẩn trong số các thử nghiệm dựa trên khái niệm UMP (hoặc UMP trong số các thử nghiệm không thiên vị).

Có bất kỳ lợi ích nào trong việc xác định CI là một tương ứng với thử nghiệm UMP hoặc một cái gì đó tương tự không?


(+1) Có hai khó khăn với đề xuất của bạn. Đầu tiên là các bài kiểm tra UMP thường không tồn tại. Thứ hai là một cách hiệu quả để đánh giá khoảng tin cậy là về chức năng mất liên quan. Điều này cho phép một loạt các giải pháp linh hoạt nhưng rộng rãi.
whuber

1
Định nghĩa về khoảng tin cậy không phải là những gì bạn yêu cầu, như đã thảo luận ở một số nơi trên trang web này, ví dụ: tại đây: stats.stackexchange.com/questions/13655/ và ở đây: stats.stackexchange.com/a/6431/5829
Jake Westfall

Mục đích của CI cho bạn là gì? Bạn đang cố gắng làm gì với nó?
Aksakal

@Aksakal thực sự, tôi chỉ nhận ra rằng tôi rất bối rối về khái niệm này và muốn hiểu nó tốt hơn. Không cụ thể cho bất kỳ ứng dụng.
tối đa

@JakeWestfall Tôi tìm thấy một cuộc thảo luận thú vị nhưng không có định nghĩa rõ ràng trong một trong những liên kết đó. Bạn có thể chỉ cho tôi một định nghĩa cụ thể? Tôi không khẳng định định nghĩa của mình là đúng, nhưng đó là tất cả những gì tôi tìm thấy sau khi tìm kiếm ngắn gọn trong sách giáo khoa thống kê. Trên thực tế, định nghĩa tương tự được đưa ra trong bài báo Morey được đề cập trong câu trả lời của Alex
tối đa

Câu trả lời:


1

Một chút dài cho một nhận xét. Kiểm tra các cuộc thảo luận về UMP trong bài báo này "Sự sai lầm của việc đặt niềm tin vào các khoảng tin cậy" của Morey et al. Cụ thể, có một số ví dụ trong đó:

"Điều kỳ lạ hơn nữa là các khoảng thời gian từ thủ tục UMP ban đầu tăng chiều rộng với độ không đảm bảo của dữ liệu, nhưng khi chiều rộng của khả năng lớn hơn 5 mét, độ rộng của khoảng UMP có liên quan nghịch với độ không đảm bảo của dữ liệu, Giống như các khoảng không theo tỷ lệ. Các thủ tục phân phối UMP và lấy mẫu chia sẻ sự khác biệt đáng ngờ rằng các TCTD của họ không thể được sử dụng để làm ngược lại các quan sát. Mặc dù là thủ tục mạnh nhất, nhưng thủ tục UMP rõ ràng sẽ loại bỏ thông tin quan trọng. "


Còn hướng khác thì sao? Cho một khoảng tin cậy tốt, thử nghiệm giả thuyết null tương ứng thường tốt?
tối đa

0

Từ chối chỉ là một phần của suy luận, đừng bị mắc kẹt ở đó. Bạn đang đưa ra quyết định. Giả sử bạn cần quyết định xem có nên đi đến thợ máy hay không khi đèn "kiểm tra động cơ" bật hoặc quên nó.

α= =0,01

Đó không phải là cách các quyết định được đưa ra và tầm quan trọng của kinh tế nên được tính đến. Bạn phải tính toán chi phí đi với null so với từ chối nó và chọn hypo thay thế.

Tôi đã hoàn toàn bỏ qua giả thuyết thay thế trong ví dụ trên, bởi vì đó là cách mọi người thực hiện nó: họ nghĩ rằng hypo thay thế chỉ là một loại hình thức như curtsy. Trong cuộc sống thay thế cũng quan trọng như null, bởi vì đó là cách bạn tính toán chi phí của việc không chọn null. Chỉ khi bạn tính đến chi phí vô giá trị và thay thế, bạn mới nên đưa ra quyết định đi hay không đi đến thợ máy. Giá trị p và khoảng tin cậy của riêng chúng không có ý nghĩa gì trong vấn đề này, chỉ khi kết hợp với chi phí chúng trở nên có ý nghĩa


Tôi không có nghĩa là từ chối là kết thúc của câu chuyện. Tôi thực sự ngạc nhiên khi tôi nhận ra tất cả các định nghĩa về CI mà tôi thấy cho phép CI không độc đáo. Với tất cả các cảnh báo khác xung quanh việc sử dụng CI, tôi hy vọng ít nhất không phải đối phó với thực tế rằng sự lựa chọn của bất kỳ CI cụ thể nào là tùy ý.
tối đa
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.