Bạn có thể giải thích tại sao cà vạt thống kê không bị từ chối một cách ngây thơ khi


12

Tôi cần trợ giúp để giải thích và trích dẫn các văn bản thống kê cơ bản, bài báo hoặc các tài liệu tham khảo khác, tại sao nói chung là không chính xác khi sử dụng thống kê biên lỗi (MOE) được báo cáo trong bỏ phiếu để tuyên bố một cách ngây thơ một ràng buộc thống kê.

Một ví dụ: Ứng cử viên A dẫn đầu Ứng cử viên B trong một cuộc thăm dò, phần trăm, tỷ lệ sai sót 4,5 % cho 500 cử tri được khảo sát.39314.5%500

Bạn tôi lý do như vậy:

Do sự phức tạp của mô hình thống kê, biên sai số có nghĩa là mức hỗ trợ thực sự của A có thể thấp tới 34,5% và B có thể cao tới 35,5%. Do đó, A và B thực sự ở nhiệt độ chết thống kê.

Tất cả sự giúp đỡ đánh giá cao trong việc nói rõ ràng lỗ hổng lý luận của bạn tôi. Tôi đã cố gắng giải thích rằng đó là không chính xác để ngây thơ bác bỏ giả thiết "A dẫn B" nếu . pApB<2MOE

Câu trả lời:


7

Nỗ lực đầu tiên của tôi về một câu trả lời là thiếu sót (xem bên dưới để biết câu trả lời thiếu sót). Lý do còn thiếu sót là biên độ sai số (MOE) được báo cáo áp dụng cho tỷ lệ bỏ phiếu của một ứng cử viên nhưng không phải là sự khác biệt của tỷ lệ phần trăm. Nỗ lực thứ hai của tôi giải quyết rõ ràng câu hỏi do OP đặt ra tốt hơn một chút.

Lần thử thứ hai

Lý do bạn bè của OP như sau:

  1. Xây dựng khoảng tin cậy cho Ứng viên A và Ứng viên B riêng biệt bằng cách sử dụng MOE đã cho.
  2. Nếu chúng trùng nhau, chúng ta có một điểm chết thống kê và nếu chúng không thì A hiện đang dẫn đầu B.

Vấn đề chính ở đây là bước đầu tiên không hợp lệ. Xây dựng khoảng tin cậy một cách độc lập cho hai ứng cử viên không phải là một bước hợp lệ vì tỷ lệ bỏ phiếu cho hai ứng cử viên là các biến ngẫu nhiên phụ thuộc. Nói cách khác, một cử tri quyết định không bỏ phiếu cho A có thể có khả năng quyết định bỏ phiếu cho B thay vào đó. Do đó, cách chính xác để đánh giá xem khách hàng tiềm năng có ý nghĩa hay không là xây dựng khoảng tin cậy cho sự khác biệt. Xem wiki để biết cách tính sai số chuẩn cho sự khác biệt của tỷ lệ bỏ phiếu theo một số giả định.

Câu trả lời thiếu sót dưới đây

Theo tôi, cách 'chính xác' để nghĩ về kết quả bỏ phiếu như sau:

Trong một cuộc khảo sát với 500 cử tri, cơ hội mà chúng ta sẽ thấy sự khác biệt về chì cao tới 8% là lớn hơn 5%.

Cho dù bạn tin rằng 'A dẫn B' hay 'A quan hệ B' thì tùy thuộc vào mức độ bạn sẵn sàng chấp nhận 5% làm tiêu chí cắt giảm của mình.


@Srikvant. Giả sử 5% là ý nghĩa chấp nhận được. Tôi đang tìm kiếm một câu trả lời chính xác hơn, câu trả lời cho thấy "A dẫn B" là một thống kê mới, sự khác biệt của pA và pB, và đó là khoảng tin cậy tương ứng không chỉ đơn giản là 2 * MOE.

4

Thật dễ dàng để giải thích về độ lệch chuẩn, hơn là khoảng tin cậy.

pA+pB=1pB=1pA

Var(pApB)=Var(2pA1)=4Var(pA)
SD(pApB)=2SD(pA).
pApB
Var(pApB)=Var(pA)+Var(pB)2Cov(pA,pB).

Outside this simple model, if pA+pB=1 does not hold in general, then you must take into account the correlation between pA and pB that is not included in the margin of error. It is possible for SD(pApB)2SD(pA).

But all this nuance seems to indicate that the polling organizations should report the margin of error on the difference. Where’s Nate Silver?


3

Đó không chỉ là một cách tồi để thuật ngữ mà còn không phải là một sức nóng chết người thống kê.

MOE chỉ là một mặt của khoảng tin cậy và dường như bạn đang áp dụng nó đúng ở một khía cạnh. Điểm của thí sinh B không chắc cao hơn 35,5%. Vì thường là khoảng tin cậy 95% nên điểm của Ứng viên B sẽ cao hơn 35,5% dưới 5% thời gian. Không phải là không thể, chỉ thường được coi là không thể. Mặt khác, số điểm nói 34% cũng có xác suất cắt. Nó chỉ không được báo cáo. Đây có lẽ là một cái gì đó thấp hơn cơ hội ngẫu nhiên, chúng ta chỉ không biết nó là gì từ MOE. Do đó, hoàn toàn không đúng khi nói rằng điểm số với điểm cắt MOE hoàn toàn có khả năng ngẫu nhiên như nhau. Đó là hàm ý của sự khẳng định nhiệt chết thống kê.

Không chỉ vậy, bạn không sử dụng khoảng tin cậy chồng chéo theo cách đó. Nếu bạn thực sự muốn chỉ nói rằng Ứng viên A sẽ chiến thắng nếu xác suất Ứng viên B chiến thắng dưới 5% thì Ứng viên A chắc chắn dẫn đầu. Dẫn đầu là 8%. Khoảng tin cậy của điểm trừ đó không gấp đôi khoảng tin cậy của điểm số riêng lẻ mà chỉ bằng sqrt (2) lần so với điểm số đó. Đó là bởi vì việc tìm ra sự khác biệt giữa các giá trị sẽ chỉ nhân đôi phương sai. Khoảng tin cậy được dựa trên một sqrt của phương sai do đó kết hợp chúng là trung bình (4,5) * sqrt (2). Vì MOE của khách hàng tiềm năng 8% của bạn là khoảng 6,4%, nên Ứng viên A đang dẫn đầu.

Bên cạnh đó, MOE rất bảo thủ và dựa trên giá trị lựa chọn 50%. Công thức là sqrt (0,25 / n) * 2. Có một công thức để tính toán các lỗi tiêu chuẩn của điểm số chênh lệch mà chúng ta cũng có thể sử dụng. Chúng tôi sẽ áp dụng rằng sử dụng các giá trị được tìm thấy thay vì cắt giảm 50% và điều đó vẫn mang lại cho chúng tôi một vị trí dẫn đầu đáng kể cho Ứng viên A (7,5% MOE). Tôi tin rằng, đưa ra nhận xét của người hỏi và sự gần gũi của câu hỏi giả định được chọn, đó có lẽ là điều họ đang tìm kiếm. Mặc dù vậy, tôi thích câu trả lời của mình hơn bởi vì, mặc dù không phải là toán học chính xác nhất trong trường hợp này, đó là cách nói chung để so sánh dữ liệu trong đó khoảng tin cậy được báo cáo cho các giá trị riêng lẻ và đưa ra một khung suy nghĩ về lý do tại sao CI không tăng gấp đôi.

Any introduction to both confidence intervals and to power would be helpful here. Even the wikipedia article on MOE looks pretty good.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.