SurveyMonkey có bỏ qua thực tế là bạn lấy một mẫu không ngẫu nhiên không?


11

SurveyMonkey có các bước và biểu đồ để bạn tìm ra cỡ mẫu bạn cần cho một mức sai số hoặc khoảng tin cậy nhất định, dựa trên quy mô dân số của bạn.

Cỡ mẫu SurveyMonkey

Có phải biểu đồ này chỉ đơn giản bỏ qua thực tế là bạn sẽ không nhận được một mẫu ngẫu nhiên, vì bạn chỉ nhận được những người bận tâm trả lời khảo sát?

Tôi đang được cảnh báo khi tôi gõ câu hỏi này rằng câu hỏi có vẻ chủ quan nên có lẽ tôi không hỏi chính xác. Đây không thực sự là về SurveyMonkey nhưng là một câu hỏi tổng quát hơn - bạn thực sự có thể tính khoảng tin cậy từ dữ liệu phản hồi tự nguyện bằng cách sử dụng một số kỹ thuật nâng cao mà tôi không biết?

Trong các cuộc thăm dò ý kiến ​​hoặc khảo sát quốc gia, rõ ràng họ phải đối phó với vấn đề này. Giáo dục của tôi không bao gồm các kỹ thuật lấy mẫu khảo sát chuyên sâu nhưng tôi cho rằng nó liên quan đến việc thu thập dữ liệu nhân khẩu học và sử dụng điều đó để biết mức độ đại diện của mẫu bạn có.

Nhưng bên cạnh đó, đối với một cuộc khảo sát trực tuyến đơn giản, họ chỉ cho rằng những người bận tâm trả lời là một mẫu ngẫu nhiên của dân số?

Câu trả lời:


10

Câu trả lời ngắn gọn là có: Survey Monkey bỏ qua chính xác cách bạn lấy mẫu của mình. Survey Monkey không đủ thông minh để cho rằng những gì bạn đã thu thập không phải là một mẫu thuận tiện, nhưng hầu như mọi khảo sát của Monkey Monkey đều là một mẫu thuận tiện. Điều này tạo ra sự khác biệt lớn trong chính xác những gì bạn ước tính mà không có lượng mẫu tuyệt đối nào có thể / sẽ loại bỏ. Một mặt, bạn có thể xác định dân số (và các hiệp hội trong đó) bạn sẽ có được từ SRS. Mặt khác, bạn có thể xác định một dân số được xác định bởi lấy mẫu không ngẫu nhiên của bạn, các hiệp hội ở đó bạn có thểước tính (và các quy tắc sức mạnh giữ cho các giá trị như vậy). Tùy thuộc vào bạn là một nhà nghiên cứu để thảo luận về sự khác biệt và để người đọc quyết định chính xác mức độ hợp lệ của mẫu không ngẫu nhiên có thể có trong việc xấp xỉ một xu hướng thực sự.

Như một điểm, có những cách sử dụng không nhất quán của thuật ngữ thiên vị. Trong lý thuyết xác suất, độ lệch của công cụ ước tính được xác định bởi . Tuy nhiên, một công cụ ước tính có thể bị sai lệch, nhưng nhất quán, do đó độ lệch "biến mất" trong các mẫu lớn, chẳng hạn như độ lệch của ước tính khả năng tối đa của độ lệch chuẩn của RVs phân phối thông thường. tức là . Các công cụ ước tính không có sai lệch biến mất, (ví dụ ) được gọi là không nhất quánBiasn=θθ^nθ^pθθ^pθtrong lý thuyết xác suất. Các chuyên gia thiết kế nghiên cứu (như các nhà dịch tễ học) đã chọn một thói quen xấu là gọi sự không nhất quán là "thiên vị". Trong trường hợp này, đó là xu hướng lựa chọn hoặc thiên vị tình nguyện. Đây chắc chắn là một dạng sai lệch, nhưng sự không nhất quán ngụ ý rằng không có số lượng mẫu nào sẽ khắc phục được vấn đề.

Để ước tính các liên kết mức dân số từ dữ liệu mẫu thuận tiện, bạn sẽ phải xác định chính xác cơ chế xác suất lấy mẫu và sử dụng trọng số xác suất nghịch đảo trong tất cả các ước tính của bạn. Trong những tình huống rất hiếm, điều này có ý nghĩa. Xác định một cơ chế như vậy là không thể trong thực tế. Một thời gian có thể được thực hiện là trong một nhóm các cá nhân có thông tin trước đó được tiếp cận để điền vào một cuộc khảo sát. Xác suất không phản hồi có thể được ước tính là một chức năng của thông tin trước đó, ví dụ như tuổi tác, giới tính, SES, ... Trọng số cho bạn cơ hội ngoại suy những kết quả sẽ có trong dân số không phản hồi. Điều tra dân số là một ví dụ tốt về sự liên quan của trọng số xác suất nghịch đảo cho các phân tích như vậy.


2
Bạn có thể giải thích một chút về ý nghĩa trong đó một mẫu thuận tiện có thể được coi là không nhất quán nhưng không sai lệch ? Trong lịch sử, nhiều mẫu thuận tiện đã bị sai lệch nghiêm trọng (và "thiên vị" chính xác là thuật ngữ mà mọi người đã sử dụng để mô tả chúng): cuộc thăm dò ý kiến ​​văn học năm 1936 có lẽ là ví dụ nổi tiếng nhất.
whuber

1
@whuber Hãy tha thứ cho việc sử dụng thuật ngữ "không nhất quán" của tôi. Xu hướng là thứ tôi cho là sẽ biến mất trong các mẫu lớn, trong khi ước tính không nhất quán không bao giờ hội tụ trong các mẫu lớn. Trong lý thuyết thăm dò, các ví dụ về các công cụ ước tính không nhất quán là rất ít và xa, nhưng từ góc độ thiết kế nghiên cứu, chúng mọc lên mọi lúc. Thật thú vị, các nhà dịch tễ học có xu hướng gọi đó là "thiên vị" (nghĩa là thiên vị lựa chọn). Nhưng câu hỏi về áp phích dường như cho thấy rằng "lấy mẫu nhiều hơn" sẽ làm giảm bớt sự thiên vị, như có thể là trường hợp với loại sai lệch lý thuyết xác suất.
AdamO

Tôi không chắc là tôi đã hiểu tất cả những điều đó, vì vậy hãy để tôi tập trung vào một phần nhỏ: bạn (hoặc bạn không) khẳng định rằng các mẫu [tiện lợi] lớn hơn có làm giảm sai lệch không? Tôi hy vọng bạn không, bởi vì điều đó chắc chắn là sai! (Đây là một trong những lý do các cuộc thăm dò Literary Digest là khét tiếng: nó là một trong những lớn nhất từng được thực hiện và trưng bày một trong những thành kiến lớn, quá.)
whuber

5
Quả thực là không! Lấy mẫu nhiều hơn sẽ không loại bỏ sự thiên vị nội tại như vậy. Đó là vấn đề ở đây. Người đăng quan tâm đến sức mạnh để ước tính liên kết dân số với một mẫu không ngẫu nhiên, và quan điểm của tôi là bạn luôn có 0 sức mạnh để ước tính điều đó (trừ khi các cơ chế trọng số rất cẩn thận và phức tạp được sử dụng).
AdamO

1
Cảm ơn bạn đã bình luận cuối cùng; nó xóa một phần câu trả lời của bạn mà tôi có thể đã giải thích sai. (+1)
whuber
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.