Liệu nó có ý nghĩa để tính khoảng tin cậy và kiểm tra các giả thuyết khi dữ liệu từ toàn bộ dân số có sẵn?


10

Liệu nó có ý nghĩa để tính khoảng tin cậy và kiểm tra các giả thuyết khi dữ liệu từ toàn bộ dân số có sẵn? Theo tôi, câu trả lời là không, vì chúng ta có thể tính toán chính xác các giá trị thực của các tham số. Nhưng sau đó, tỷ lệ tối đa của dữ liệu từ dân số ban đầu cho phép chúng ta sử dụng các kỹ thuật nói trên là gì?


3
Nếu bạn sử dụng các phương pháp mẫu hữu hạn chính xác, phương sai sẽ về 0 giống như mẫu của bạn đạt kích thước dân số. Đó là, không có kích thước tối đa; các công thức thích hợp làm việc như họ nên, phải lên đến . n=N
Glen_b -Reinstate Monica

Tôi nghĩ bạn nên nói rõ hơn nếu câu hỏi liên quan đến trường hợp "mẫu = dân số" hoặc trường hợp "mẫu từ dân số hữu hạn".
ttnphns

Phần đầu của câu hỏi là về mẫu = dân số và thứ hai về mẫu từ dân số (khi cỡ mẫu <cỡ dân số).
Miroslav Sabo

Câu trả lời:


9

Câu hỏi đầu tiên là câu hỏi không có câu trả lời chung. Quan điểm riêng của tôi giống như của bạn, nhưng những người khác đã lập luận rằng một dân số có thể được xem như một mẫu từ một "siêu dân số" trong đó bản chất chính xác của một siêu dân số khác nhau tùy thuộc vào bối cảnh: Ví dụ: điều tra dân số của tất cả những người sống trong một tòa nhà có thể được xem như một mẫu từ tất cả những người sống trong các tòa nhà tương tự; một cuộc điều tra dân số Hoa Kỳ (không phải là người ta có thể thực sự hoàn thành) có thể được xem như một mẫu từ một siêu dân số người Mỹ có thể tồn tại một ngày nào đó (hoặc một cái gì đó tương tự). Tôi nghĩ rằng đây thường là một cái cớ để sử dụng giá trị p; nhiều nhà khoa học trong các lĩnh vực thực chất không thoải mái nếu họ không có giá trị p. (Nhưng đó là quan điểm của tôi ).

Câu hỏi thứ hai có vẻ hơi kỳ lạ để trả lời một cách chung chung. Khi nào bạn nhận được một mẫu (thậm chí) hơn một nửa dân số?

Một vấn đề lớn hơn sẽ là thiên vị. Quay trở lại Tổng điều tra dân số Hoa Kỳ, vấn đề không chỉ đơn giản là nó nhớ mọi người, mà là những người mà họ nhớ không phải là một mẫu ngẫu nhiên trong tổng dân số; vì vậy, ngay cả khi điều tra dân số nhận được câu trả lời từ (để chọn một số) 95% của tất cả mọi người, nếu 5% còn lại khá khác nhau, thì kết quả sẽ bị sai lệch.


1
Tôi nghĩ rằng liệu bạn có tính toán khoảng tin cậy cho thống kê dân số hay không phụ thuộc vào việc bạn muốn suy luận về dân số thực tế hay cho "siêu dân số" giả thuyết. Trong một công việc trước đây với bộ y tế nhà nước, chúng tôi đã báo cáo số liệu thống kê hàng năm như tỷ lệ phần trăm cân nặng khi sinh rất thấp và tỷ lệ tự tử bị trả lại từ năm này sang năm khác. Vâng, chúng tôi đã báo cáo về toàn bộ dân số, tuy nhiên sẽ thật ngớ ngẩn khi điều chỉnh tiến trình y tế của Nhà nước (và tài trợ!) Về mỗi lần tăng hoặc giảm các chỉ số sức khỏe này và sự thay đổi hoàn toàn về sức khỏe của dân số.
RobertF

7

Giả sử chỉ có 2 trong số 12 thành viên ủy ban là phụ nữ.

16

Hoặc nó có thể được coi là một ước tính về xác suất của một người phụ nữ được chọn cho ủy ban một tài sản của quá trình lựa chọn. Bạn có thể đặt khoảng tin cậy xung quanh nó, kiểm tra xem nó có khác biệt đáng kể so với một nửa (hoặc giả thuyết không có liên quan khác không), v.v. Có lẽ quá trình cần phải được thay đổi để làm cho nó công bằng.

Hai quan điểm, mô tả và suy luận, không mâu thuẫn, nhưng khá khác biệt.

Câu trả lời cho câu hỏi thứ hai là việc tính các khoảng tin cậy cho các giả thuyết & kiểm tra về một tham số dân số có ý nghĩa ngay cả khi chỉ một cá nhân duy nhất không được ghép. Chỉ cần lưu ý rằng các TCTD & xét nghiệm phải tính đến một tỷ lệ đáng kể của dân số được lấy mẫu: xem điều chỉnh dân số hữu hạn .

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.