Mô hình lấy mẫu cho dữ liệu đám đông?


18

Tôi đang làm việc trên một ứng dụng khảo sát sức khỏe mở, dự kiến ​​sẽ được sử dụng ở các nước đang phát triển.

Ý tưởng cơ bản là các cuộc phỏng vấn khảo sát được tổ chức đông người - chúng được thực hiện bởi các tình nguyện viên không có tổ chức, người gửi biểu mẫu dữ liệu của các cuộc phỏng vấn họ thực hiện bằng cách sử dụng thiết bị di động của họ và mỗi cuộc khảo sát đều có dữ liệu GPS của địa điểm phỏng vấn.

Các khảo sát truyền thống được biên soạn bởi các cơ quan chính phủ thường được thực hiện bằng cách sử dụng một số mô hình lấy mẫu tiêu chuẩn - thường là mô hình lấy mẫu xác suất. Điều này đòi hỏi rất nhiều kế hoạch tập trung mà không thể luôn luôn được thực hiện. (đã đề cập điều này để đặt câu hỏi của tôi trong bối cảnh phù hợp)

Chúng tôi có thể nói rằng một tình nguyện viên sẽ thực hiện lấy mẫu thuận tiện xung quanh khu vực của mình. Anh ta sẽ phỏng vấn tùy ý số người mà anh ta có thể tiếp cận.

Vấn đề cơ bản là: Làm thế nào có thể hiểu và mô tả mô hình lấy mẫu tổng thể của hệ thống khảo sát này? Có bất kỳ phương pháp hoặc mô hình sáng tác để đối phó với các trường hợp như vậy?

Câu trả lời:


15

Câu trả lời ngắn: Đây là một mẫu thuận tiện. Bạn không thể làm gì để biện minh cho điều đó.

Một câu trả lời dài hơn: bạn đang ở trong cùng một nhóm với nhiều mạng xã hội thực hiện các cuộc khảo sát nội bộ của họ mà không có nhiều ý tưởng về việc ai sẽ trả lời khảo sát một câu hỏi sẽ xuất hiện ngẫu nhiên trên Facebook hoặc Google + ... ngoại trừ việc không giống như những người khổng lồ này, bạn không Không có bất kỳ dữ liệu nào về những người không trả lời. Cộng đồng nghiên cứu và nghiên cứu dư luận nói chung cau mày với loại công việc này, vì không rõ ràng làm thế nào kết quả của các mẫu sai lệch nặng nề này có thể được khái quát cho tổng dân số (nếu có). Bạn có thể cố gắng điều chỉnh lại theo các nhân khẩu học đã biết, nhưng sau đó bạn sẽ kết thúc với một biến thể của trọng số từ 1 cho một người chỉ đại diện cho 1.000.000 người được chỉ định cho hơn 70 nam giới trong dân số biết sử dụng máy tính (và có khả năng không đại diện cho 1.000.000 70+ nam giới còn lại, dù sao đi nữa).

Đọc thêm: "Cách nói dối với thống kê" mở đầu bằng một chương về các mẫu thiên vị. Nếu bạn có thể đọc nó và không khóc vì thất vọng về thiết kế mẫu của mình, bạn có thể tiếp tục. Nếu bạn dựa vào các tình nguyện viên, mẫu của bạn sẽ thiên về dân số trẻ và thành thị với khả năng tiếp cận tốt hơn với các thiết bị điện tử. Tương tự, tập sách "Khảo sát là gì" do Fritz Scheuren, cựu chủ tịch Hiệp hội Thống kê Hoa Kỳ, mở ra với bức tranh về Harry Truman mà chiến thắng không thể dự đoán được bằng các kỹ thuật bỏ phiếu thiên vị tồn tại vào thời điểm đó.

Có một số nghiên cứu về dân số khó tiếp cận . Một dự án nổi tiếng là một nghiên cứu về số người chết quá mức ở Iraq, nơi các khu vực địa lý được lấy mẫu, và ở mỗi khu vực, bác sĩ địa phương sẽ cố gắng thu hút các cuộc phỏng vấn từ mọi hộ gia đình trong thành phố. Đã có sự phê phán về thiết kế này, nhưng dù làm hỏng nó, nó vẫn có thành phần lấy mẫu. Xem các giấy tờ trong Lancet (như bạn có thể biết, bạn không thể có thêm uy tín nào trong thế giới y tế) http://dx.doi.org/10.1016/S0140-6736(04)17441-2http: //dx.doi .org / 10.1016 / S0140-6736 (06) 69491-9 .


(+1) Stas, có gì khác về cơ bản ở đây so với lấy mẫu hạn ngạch không? Chỉ tò mò, một cách đọc chữ thảo của câu hỏi làm cho nó trông giống như một sự thay đổi trong thuật ngữ. Ngoài ra, một thời gian ngắn, các phê bình chính của nghiên cứu lấy mẫu cụm Iraq là gì? Tôi nhớ đã nhìn thấy điều này khi nó lần đầu tiên xuất hiện và đọc một chút về nó.
Đức hồng y

Tôi cho rằng một điểm khác biệt là không có hạn ngạch cho mỗi cá nhân ...;)
hồng y

Cảm ơn rât nhiều! Bây giờ, tôi đã hiểu rõ trước khi tôi thiết kế lại ý tưởng!
al-Amjad Tawfiq Isstaif


Tôi nghĩ rằng có vấn đề với số lượng nhỏ các cụm, và một cụm kết thúc một ngoại lệ nơi hoạt động quân sự cao hơn bất cứ nơi nào khác trong nước. Đối với tôi, điều đầu tiên cần xem xét là các tuyên bố của AAPOR và ASA về nghiên cứu này. Trong khi Lancet có thể là một tạp chí y khoa tuyệt vời và John Hopkins, một chuyên gia y tế tuyệt vời, đánh hơi tại cơ quan AAPOR và từ chối họ, các tài liệu phương pháp học chỉ là không chuyên nghiệp.
StasK
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.