Làm thế nào để chọn một mức độ tự tin?


12

Tôi thường sử dụng mức độ tin cậy 90%, chấp nhận rằng điều này có mức độ không chắc chắn lớn hơn 95% hoặc 99%.

Nhưng có hướng dẫn nào về cách chọn mức độ tự tin phù hợp không? Hoặc hướng dẫn cho các mức độ tin cậy được sử dụng trong các lĩnh vực khác nhau?

Ngoài ra, trong việc diễn giải và trình bày mức độ tin cậy, có hướng dẫn nào để biến số thành ngôn ngữ không? Ví dụ: chẳng hạn như các hướng dẫn như thế này cho Pearson's r ( chỉnh sửa: những mô tả này dành cho khoa học xã hội):

http://facemony.quinnipiac.edu/libarts/polsci/Statistic.html

Cập nhật

Cảm ơn câu trả lời dưới đây. Họ đều rất hữu ích, sâu sắc và hướng dẫn.

Ngoài ra, dưới đây là một số bài viết hay về việc chọn mức ý nghĩa (về cơ bản là cùng một câu hỏi) mà tôi đã gặp trong khi xem xét câu hỏi này. Họ xác nhận những gì được nói trong các câu trả lời dưới đây.

"Ý nghĩa của 0,05 có ý nghĩa gì?"

http://www.p-value.info/2013/01/whats-significance-of-005-significance_6.html

"Về nguồn gốc của mức 0,05 có ý nghĩa thống kê"

http://www.radford.edu/~jaspelme/611/Spring-2007/Cowles-n-Davis_Am-Psyc_orignis-of-05-level.pdf

"Phương pháp khoa học: Lỗi thống kê"

http://www.nature.com/news/scientific-method-statistic-errors-1.14700

Câu trả lời:


9

Ngoài câu trả lời tuyệt vời của Tim, thậm chí còn có một lý do khác nhau trong một lĩnh vực cho các khoảng tin cậy cụ thể. Ví dụ, trong một thử nghiệm lâm sàng cho thuốc xịt tóc, bạn sẽ rất tự tin rằng việc điều trị của bạn không có khả năng giết chết bất cứ ai, nói 99,99%, nhưng bạn sẽ hoàn toàn ổn với khoảng tin cậy 75% mà keo xịt tóc giúp bạn giữ tóc thẳng.

Nói chung, khoảng tin cậy nên được sử dụng theo cách mà bạn cảm thấy thoải mái với sự không chắc chắn, nhưng cũng không quá nghiêm ngặt, chúng làm giảm sức mạnh nghiên cứu của bạn thành không liên quan. Khoảng tin cậy 90% có nghĩa là khi lặp lại việc lấy mẫu, bạn sẽ mong đợi rằng một lần trong mười khoảng thời gian tạo sẽ không bao gồm giá trị thực. Dựa trên những gì bạn đang nghiên cứu, điều đó có được chấp nhận không? Mặt khác, nếu bạn thích khoảng tin cậy 99%, kích thước mẫu của bạn có đủ để khoảng thời gian của bạn không quá lớn không? (Hy vọng bạn quyết định cấp độ CI trước khi thực hiện nghiên cứu, phải không?)

Theo kinh nghiệm của tôi (về khoa học xã hội) và từ những gì tôi đã thấy về vợ tôi (về khoa học sinh học), trong khi có các tiêu chuẩn CI / ý nghĩa trong các lĩnh vực khác nhau và các trường hợp cụ thể khác nhau, không có gì lạ đối với phần lớn các cuộc tranh luận về một chủ đề là liệu bạn có đặt mức độ quan trọng hoặc mức ý nghĩa của CI không. Tôi đã tham gia các cuộc họp mà một nhà thống kê kiên nhẫn giải thích với khách hàng rằng trong khi họ có thể thích khoảng tin cậy hai bên 99%, thì dữ liệu của họ sẽ cho thấy tầm quan trọng của họ, họ sẽ phải tăng gấp 10 lần mẫu của họ; và tôi đã tham gia các cuộc họp nơi khách hàng hỏi tại sao không có dữ liệu nào của họ cho thấy sự khác biệt đáng kể, nơi chúng tôi kiên nhẫn giải thích cho họ vì họ đã chọn một khoảng thời gian cao - hoặc ngược lại, mọi thứ đều có ý nghĩa vì yêu cầu khoảng cách thấp hơn.

Những gì tôi đề nghị là đọc một số bài báo chính trong lĩnh vực của bạn (càng gần với chủ đề cụ thể của bạn càng tốt) và xem những gì họ sử dụng; kết hợp điều đó với mức độ thoải mái và kích thước mẫu của bạn; và sau đó sẵn sàng bảo vệ những gì bạn chọn với thông tin đó trong tay. Trừ khi bạn ở trong một lĩnh vực có các quy tắc rất nghiêm ngặt - các thử nghiệm lâm sàng tôi nghi ngờ là những người duy nhất thực sự nghiêm ngặt, ít nhất là từ những gì tôi đã thấy - bạn sẽ không thấy gì tốt hơn. (Và nếu có các quy tắc nghiêm ngặt, tôi mong các bài báo chính trong lĩnh vực của bạn tuân theo nó!)


5
α

2
@Alexis Thật không may, cứ vài nghìn người dùng, một trong số họ có khả năng quên không bao giờ sử dụng bật lửa trong khi xịt tóc ...
Joe

2
"Khoảng tin cậy 90% có nghĩa là một lần trong mười bạn sẽ tìm thấy một ngoại lệ." Điều này hoàn toàn sai, trừ khi tôi hiểu sai về bạn
Shadowtalker

2
90% CI có nghĩa là 90% thời gian, trung bình dân số nằm trong khoảng tin cậy và 10% nằm ngoài (một bên hoặc bên kia) của khoảng thời gian. Do đó, 1 trong số 10 lần, kết quả của bạn không bao gồm giá trị trung bình thực. Có lẽ 'ngoại lệ' là từ sai (mặc dù các TCTD thường được sử dụng cho mục đích đó.)
Joe

@Joe, tôi nhận ra đây là một phần bình luận cũ, nhưng điều này là sai. Bạn có thể có một CI ở bất kỳ mức độ 'tự tin' nào không bao gồm giá trị thực. Xem tại đây: stats.stackexchange.com/a/26457/176202
Frans Rodenburg

20

Chọn một phạm vi khoảng tin cậy là một quyết định chủ quan . Bạn có thể chọn bất kỳ khoảng tin cậy nào theo nghĩa đen: 50%, 90%, 99.999% ... vv Đó là về mức độ tự tin mà bạn muốn có. Có lẽ thường được sử dụng là 95% CI.

Về phần diễn giải và liên kết bạn cung cấp ... Những cách diễn giải này là sự đơn giản hóa . Tương quan là một ví dụ tốt, bởi vì trong các bối cảnh khác nhau, các giá trị khác nhau có thể được coi là tương quan "mạnh" hoặc "yếu", hãy xem một số ví dụ ngẫu nhiên từ web :

  • Có lần tôi đã hỏi một nhà hóa học đang hiệu chỉnh dụng cụ phòng thí nghiệm theo tiêu chuẩn giá trị của hệ số tương quan mà cô ấy đang tìm kiếm. Số 0,9 quá thấp. Bạn cần ít nhất 0,98 hoặc 0,99. Cô ấy đã nhận được số từ tài liệu hướng dẫn của chính phủ.
  • Tôi đã từng hỏi một kỹ sư đang tiến hành phân tích hồi quy của một quá trình xử lý giá trị của hệ số tương quan mà anh ta đang tìm kiếm. Bất cứ điều gì từ 0,6 đến 0,8 đều được chấp nhận. Giáo sư đại học của ông đã nói với ông điều này.
  • Tôi đã từng hỏi một nhà sinh vật học đang tiến hành ANOVA về kích thước của những con chuột đồng sống trong đất bị ô nhiễm so với đất nguyên sơ, giá trị của hệ số tương quan mà anh ta đang tìm kiếm. Anh ta không biết, nhưng mức cắt của anh ta là 0,2 dựa trên sự khác biệt kích thước nhỏ nhất mà mô hình của anh ta có thể phát hiện được với số lượng mẫu anh ta có.

Xin lỗi, nhưng không có phím tắt ...

Để hiểu rõ hơn về Khoảng tin cậy, bạn có thể đọc thêm về chúng, ví dụ như ở đây , ở đây hoặc ở đây .


1
Trích dẫn hay. +1.
amip nói rằng Phục hồi Monica

Những gì bạn nói về mô tả tương quan là chính xác. Nó hoàn toàn liên quan đến lĩnh vực. Các mô tả trong liên kết là dành cho khoa học xã hội. Tôi cho rằng một mô tả cho khoảng tin cậy cũng sẽ phụ thuộc vào trường.
Oliver Moran

9

Mặc dù, nhìn chung các mức độ tin cậy được để lại theo quyết định của nhà phân tích, có những trường hợp khi chúng được đặt ra bởi luật pháp và quy định. Tôi sẽ cho bạn hai ví dụ.

Trong giám sát ngân hàng, bạn phải sử dụng mức độ tin cậy 99% khi tính toán một số rủi ro nhất định, xem p.2 trong quy định Basel này .

FDA có thể hướng dẫn sử dụng mức độ tin cậy nhất định để thử nghiệm thuốc và thiết bị trong phương pháp thống kê của họ.

Nhìn chung, đó là một thực tiễn tốt để tham khảo ý kiến ​​chuyên gia trong lĩnh vực của bạn để tìm hiểu các thực tiễn và quy định được chấp nhận liên quan đến mức độ tin cậy.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.