Tại sao người ta tuyên bố rằng một mẫu thường chính xác hơn so với điều tra dân số?


13

Khi học quá trình lấy mẫu, tôi gặp hai câu sau:

1) Lỗi lấy mẫu dẫn đến chủ yếu là biến thiên, lỗi không lấy mẫu dẫn đến sai lệch.

2) Do lỗi không lấy mẫu, một mẫu thường chính xác hơn CENSUS.

Tôi không biết làm thế nào để hiểu hai tuyên bố này. Logic cơ bản để có được hai tuyên bố này là gì?


5
Một điều tra dân số thực sự hoặc một nỗ lực ?
Đức hồng y

Câu trả lời:


16

Một mẫu có thể chính xác hơn so với điều tra dân số (đã cố gắng) nếu thực tế bài tập là điều tra dân số làm tăng sai lệch so với lỗi không lấy mẫu. Điều này có thể xảy ra, ví dụ, nếu điều tra dân số tạo ra một chiến dịch chính trị bất lợi ủng hộ việc không phản hồi (điều gì đó ít có khả năng xảy ra với một mẫu). Trừ khi điều này xảy ra, tôi không thể hiểu tại sao một mẫu sẽ được dự kiến ​​sẽ có ít lỗi không lấy mẫu hơn so với điều tra dân số; và theo định nghĩa, nó sẽ có nhiều lỗi lấy mẫu hơn. Vì vậy, ngoài những trường hợp khá bất thường tôi sẽ nói một cuộc điều tra dân số sẽ chính xác hơn một mẫu.

Xem xét một nguồn phổ biến của lỗi không lấy mẫu - không phản hồi có hệ thống, ví dụ như bởi một nhóm nhân khẩu học xã hội cụ thể. Nếu những người thuộc nhóm X có khả năng từ chối điều tra dân số, họ cũng có khả năng từ chối mẫu. Ngay cả với poststratification lấy mẫu để cân nặng lên các câu trả lời của những người từ nhóm X người bạn làm thuyết phục để trả lời câu hỏi của bạn, bạn vẫn có một vấn đề bởi vì những có thể là phân khúc rất X có ủng hộ cuộc điều tra. Không có cách nào thực sự xung quanh vấn đề này ngoài việc cẩn thận nhất có thể với thiết kế dụng cụ và phương thức giao hàng của bạn.

Trong khi thông qua, điều này không thu hút sự chú ý đến một vấn đề có thể có thể làm cho một cuộc điều tra dân số đã cố gắng kém chính xác hơn một mẫu. Các mẫu thường xuyên có trọng số sau phân tầng cho dân số, giúp giảm thiểu các vấn đề sai lệch từ các vấn đề như trong đoạn văn trên của tôi. Một điều tra dân số đã cố gắng mà không nhận được 100% lợi nhuận chỉ là một mẫu lớn và về nguyên tắc phải chịu cùng một quy trình; nhưng bởi vì nó được coi là một "điều tra dân số" (chứ không phải là điều tra dân số đã cố gắng ) nên điều này có thể bị bỏ qua. Vì vậy, điều tra dân số thể kém chính xác hơn mẫu có trọng số phù hợp. Nhưng trong trường hợp này, vấn đề là kỹ thuật xử lý phân tích (hoặc thiếu sót), không phải là một điều gì đó thực chất đối với nó là một cuộc điều tra dân số đã cố gắng.

Hiệu quả là một vấn đề khác - như Michelle nói, một mẫu được tiến hành tốt sẽ hiệu quả hơn so với điều tra dân số và nó có thể có đủ độ chính xác cho các mục đích thực tế.


1
+1 Điều này phản ánh một nỗ lực chu đáo và nhiều thông tin để hiểu câu hỏi và điều gì thúc đẩy nó.
whuber

Tôi nghĩ rằng sự khác biệt giữa một mẫu và điều tra dân số không đầy đủ không chỉ đơn giản là xu hướng cao hơn để cân nhắc các câu trả lời trong một mẫu. Rốt cuộc, các số liệu trọng số phải đến từ một nơi nào đó - một cuộc điều tra dân số hoặc lấy mẫu chất lượng cao hơn.
Jonathan

Tôi thực sự sẽ nhấn mạnh khả năng giảm thiểu sai lệch không phản hồi trong một mẫu. Rất ít cuộc điều tra có khả năng đi hiệu quả sau sự thiên vị không phản hồi - ngay cả cuộc đấu tranh điều tra dân số Hoa Kỳ. Có lẽ những người duy nhất có thể làm tốt là các cuộc khảo sát sự hài lòng của nhân viên. Sẽ hiệu quả hơn nhiều về chi phí khi đi sau phản hồi trong một cuộc khảo sát được lấy mẫu.
Jonathan

Trong một cuộc điều tra dân số, có thể (sẽ) tốn kém để kiểm soát chất lượng mỗi cuộc phỏng vấn / ...! Vì vậy, thông thường, chất lượng dữ liệu sẽ tốt hơn trong một mẫu so với điều tra dân số.
kjetil b halvorsen

5

Tôi nghĩ rằng có những tình huống thực tế trong đó một mẫu có thể chính xác hơn. Ví dụ, chúng tôi đã thực hiện một nghiên cứu tại một thành phố ở một quốc gia đang phát triển với rất nhiều người sống ở những nơi không đăng ký và mọi người liên tục đến và đi và ngại ngùng khi trả lời. Cố gắng thực sự làm một cuộc điều tra dân số sẽ đòi hỏi một nỗ lực của Herculean, và với các nguồn lực của chúng tôi, nó sẽ phải được thực hiện trong suốt một vài tháng, khi mọi người sẽ đến và đi. Với một mẫu, chúng tôi có thể dành nhiều thời gian hơn để đảm bảo rằng chúng tôi có được phản hồi gần nhất có thể - bởi vì chúng tôi có thể giải thích những gì chúng tôi đang làm - và chúng tôi có thể làm điều đó trong một khung thời gian ngắn hơn để loại bỏ vấn đề của những người vào và ra khỏi thành phố.

VÌ VẬY Tôi nghĩ rằng câu trả lời phụ thuộc nhiều hơn vào hậu cần của những gì bạn đang làm và các nguồn khác nhau của lỗi không lấy mẫu.

Trên thực tế, một nguồn khác là cuộc khảo sát của chúng tôi rất phức tạp và chúng tôi phải đào tạo những người phỏng vấn, và việc tìm kiếm và tài trợ đủ cho những người phỏng vấn có thể đào tạo ở đất nước đó sẽ rất khó khăn.


5

Khi lấy mẫu con người để khảo sát, các mẫu thường bị cả lỗi lấy mẫu (chúng tôi chỉ nhận được ước tính) lỗi không lấy mẫu (ví dụ: mọi người từ chối trả lời khảo sát của một người, không lấy mẫu theo khung mẫu do nhu cầu thực tế như chi phí, hoặc chi phí không có khả năng xác định chính xác dân số để vẽ mẫu). Hoàn thành chính xác, với tỷ lệ phản hồi cao, một mẫu hiệu quả hơn so với điều tra dân số. Nhưng không đúng khi cho rằng không có mẫu nào có lỗi không lấy mẫu.


+1. Cảm ơn bạn đã trả lời của bạn, Michelle, và chào mừng đến với cộng đồng của chúng tôi!
whuber

1
Xin chào, rất vui được ở đây. Cảm ơn đã chào đón. :)
Michelle

1
@Michelle Chỉ cần chỉnh sửa một chút. Lỗi lấy mẫu là lỗi xuất phát từ việc không chọn toàn bộ dân số - nghĩa là lỗi do sử dụng một mẫu để suy ra các đặc điểm dân số. Lỗi không lấy mẫu là mọi thứ khác, bao gồm không phản hồi, không tạo được khung lấy mẫu đầy đủ, lỗi đo lường, v.v.
Brett

3

Tôi nghĩ chìa khóa của họ nằm trong câu trả lời của Peter Ellis: "đã cố gắng". Khi bạn lấy mẫu đúng cách, bạn sẽ tiết lộ chi tiết về việc không phản hồi, tìm ra các tầng và tìm kiếm chúng, v.v. Khi bạn quyết định thực hiện một cuộc điều tra dân số, bạn sẽ dễ dàng bỏ qua những vấn đề đó, vì bạn đang nhận được "mọi người". Vấn đề là, có lẽ bạn không nhận được tất cả mọi người, nhưng bạn không nghĩ về người mà bạn không thực sự nhận được.

Ngoài ra còn có các vấn đề thống kê với các mẫu cực lớn (như là một tỷ lệ của dân số được lấy mẫu). Tôi không đủ tinh vi để hiểu chúng, nhưng ở mức tối thiểu bạn có vấn đề với các tính toán phương sai. (Các gói như R surveybù cho những thứ như vậy trong các nhóm dân số lớn của một cuộc khảo sát và đó là lần đầu tiên tôi biết về điều này.)

Là vấn đề thứ yếu, nếu lỗi không phải là mẫu bao gồm các vấn đề do kiểm soát chất lượng ở các bước khác nhau trong quy trình, thì việc có nhiều dữ liệu (điều tra dân số) sẽ khiến việc kiểm soát chất lượng mà bạn gặp phải khó khăn hơn (với cùng tài nguyên) trên một tập hợp dữ liệu nhỏ hơn (mẫu).

Hãy tưởng tượng nếu bạn có các nguồn lực (tài chính và nhân sự) mà Cục điều tra dân số Hoa Kỳ sử dụng cho một cuộc điều tra dân số, nhưng bạn chỉ thực hiện một cuộc khảo sát với 1.000 người lớn ngẫu nhiên. Tôi nghĩ rằng bạn có quyền kiểm soát chất lượng tốt hơn và phân tích tốt hơn nhiều về các vấn đề liên quan và của chính dữ liệu.


2

Tôi nghĩ rằng lý do lấy mẫu thể (không phải) chính xác hơn so với điều tra dân số thực sự có một thành phần có thể quy cho bản chất của điều tra dân số so với mẫu và có thể được coi là nguyên nhân của điều tra dân số có khả năng sai lệch lớn hơn (rõ ràng không lấy mẫu, theo định nghĩa): trong một điều tra dân số, số lượng dân số thường không xác định. Vì vậy, giảm thiểu hoặc kiểm soát sai lệch không phản hồi là một vấn đề khó khăn hơn nhiều so với làm như vậy với một mẫu có kích thước đã biết.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.