Tôi hoàn toàn mới đối với các số liệu thống kê và lĩnh vực khoảng tin cậy. Vì vậy, điều này có thể rất tầm thường hoặc thậm chí âm thanh ngu ngốc. Tôi sẽ đánh giá cao nếu bạn có thể giúp tôi hiểu hoặc chỉ cho tôi một số tài liệu / văn bản / blog giải thích điều này tốt hơn.
Tôi thấy trên các trang tin tức khác nhau như CNN, Fox news, Politico, v.v. về các cuộc thăm dò của họ về cuộc đua Tổng thống Hoa Kỳ 2012. Mỗi cơ quan tiến hành một số cuộc thăm dò và báo cáo một số thống kê của mẫu:
CNN: Mức độ phổ biến của Obama là X% với tỷ lệ sai số +/- x1%. Cỡ mẫu 600. FOX: Mức độ phổ biến của Obama là Y% với tỷ lệ sai số +/- y1%. Cỡ mẫu 800. XYZ: Mức độ phổ biến của Obama là Z% với tỷ lệ sai số +/- z1%. Cỡ mẫu 300.
Đây là những nghi ngờ của tôi:
Làm thế nào để tôi quyết định tin tưởng cái nào? Có nên dựa trên khoảng tin cậy hay tôi nên cho rằng vì Fox có cỡ mẫu lớn hơn, nên ước tính của nó đáng tin cậy hơn? Có một mối quan hệ ngầm giữa độ tin cậy và kích thước mẫu sao cho chỉ định cái này làm giảm nhu cầu chỉ định cái kia không?
Tôi có thể xác định độ lệch chuẩn từ khoảng tin cậy không? Nếu vậy, nó có hợp lệ luôn luôn hay chỉ hợp lệ đối với các bản phân phối nhất định (như Gaussian)?
Có cách nào để tôi có thể "hợp nhất" hoặc "kết hợp" ba ước tính trên và có được ước tính của riêng mình cùng với khoảng tin cậy không? Tôi nên yêu cầu cỡ mẫu nào trong trường hợp đó?
Tôi đã chỉ đề cập đến CNN / Fox để giải thích rõ hơn về ví dụ của tôi. Tôi không có ý định bắt đầu một cuộc tranh luận của đảng Dân chủ và Cộng hòa ở đây.
Xin hãy giúp tôi hiểu những vấn đề mà tôi đã nêu ra.