Làm thế nào là lề của lỗi liên quan đến khoảng tin cậy?


11

Ai đó có thể cho tôi biết sự khác biệt giữa lề của sai số và khoảng tin cậy không? Trên Internet tôi thấy hai ý nghĩa này được sử dụng thay thế cho nhau.

Có đúng không,

"Khoảng tin cậy được hiển thị là 1,96 và được hiển thị trên biểu đồ dưới dạng lề lỗi"?


1
Các cuộc thảo luận hữu ích về chủ đề này có thể được tìm thấy bằng cách tìm kiếm trang web của chúng tôi .
whuber

Câu trả lời:


13

Internet đầy rác, như tất cả chúng ta đều biết. Nó giúp tìm các nguồn có thẩm quyền và tập trung vào chúng để giúp giải quyết các vấn đề đó. Một cuốn sách nhỏ được xuất bản bởi Hiệp hội Thống kê Hoa Kỳ (do Fritz Scheuren và "cập nhật kỹ lưỡng vào khoảng năm 1997") xác định biên độ sai số là khoảng tin cậy 95% (trang 64, bên phải).

Xét về điều này, thật đáng ngạc nhiên khi bài viết trên Wikipedia về lề lỗi sử dụng một định nghĩa khác, mặc dù nó tham chiếu cuốn sách nhỏ này! Wikipedia viết,

Biên độ sai số thường được định nghĩa là "bán kính" (hoặc một nửa chiều rộng) của khoảng tin cậy cho một thống kê cụ thể từ một khảo sát. ... Khi một báo cáo sai số toàn cầu duy nhất được báo cáo cho một khảo sát, nó đề cập đến tỷ lệ lỗi tối đa cho tất cả các tỷ lệ phần trăm được báo cáo bằng cách sử dụng toàn bộ mẫu từ khảo sát.

Nói cách khác, Wikipedia Bộ GD là một nửa sự tối đa chiều rộng của một tập hợp các khoảng tin cậy (mà có thể có coverages khác nhau từ 95%).

Chúng tôi đã thảo luận về sự nhầm lẫn này (hoặc, ít nhất, thiếu tiêu chuẩn hóa) trong các bình luận ở nơi khác trên trang web này. Kết luận của chúng tôi là bạn cần phải rõ ràng ý của bạn về "lề lỗi" bất cứ khi nào bạn sử dụng thuật ngữ đó.


7

Không có quy ước phổ biến nào về "biên sai số" là gì nhưng tôi nghĩ (như bạn đã quan sát) nó thường được sử dụng như là bán kính của khoảng tin cậy , theo tỷ lệ ban đầu của ước tính hoặc theo tỷ lệ phần trăm của một ước tính. Đôi khi nó được sử dụng đồng nghĩa với "lỗi tiêu chuẩn", vì vậy bạn cần cẩn thận để người khác hiểu ý của bạn khi bạn sử dụng nó.

Một "khoảng tin cậy" không có quy ước chung về ý nghĩa của nó. Về cơ bản, đó là phạm vi ước tính có thể được tạo bởi một quá trình ước tính, X% thời gian (95% được sử dụng phổ biến nhất) chứa giá trị thực của tham số được ước tính. Khái niệm "quy trình" này sẽ tạo ra giá trị thực X% thời gian là một chút phản trực giác và không bị trộn lẫn với "khoảng tin cậy" từ suy luận Bayes, có định nghĩa trực quan hơn nhiều, nhưng là không giống như khoảng tin cậy được sử dụng rộng rãi.

Báo giá thực tế của bạn là một chút lộn xộn và cần một số sửa chữa nhỏ như mô tả. Tôi sẽ tránh việc sử dụng bổ sung từ "lề" này và ưu tiên "thanh lỗi". Vì thế:

"Khoảng tin cậy được ước tính là 1,96 nhân với các lỗi tiêu chuẩn có liên quan và được hiển thị trên biểu đồ dưới dạng các thanh lỗi."

(Điều này đặt sang một bên câu hỏi liệu đây có phải là cách tốt để tính khoảng tin cậy hay không, điều này phụ thuộc vào mô hình của bạn, v.v. và không liên quan).

Nhận xét cuối cùng về thuật ngữ - Tôi không thích "lỗi tiêu chuẩn", nghĩa là "độ lệch chuẩn của ước tính"; hoặc "lỗi lấy mẫu" nói chung - Tôi thích suy nghĩ về tính ngẫu nhiên và phương sai của thống kê hơn là "lỗi". Nhưng tôi đã sử dụng thuật ngữ "lỗi tiêu chuẩn" ở trên vì tôi đoán nó được sử dụng rộng rãi.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.