Các khoảng tin cậy có áp dụng cho lấy mẫu hạn ngạch không?


9

Các viện bỏ phiếu của Pháp hiện đang phải đối mặt với một cuộc khủng hoảng lớn sau khi gần đây họ đã công bố những gì chỉ có thể được gọi là cuộc thăm dò kỳ cục nhất cho đến nay trong cuộc đua ngựa bầu cử tổng thống năm 2012. Thượng viện Pháp hiện đang xem xét để lập pháp về vấn đề này bằng cách buộc các viện bỏ phiếu phải công bố, trong số những điều khác, khoảng tin cậy cho kết quả của họ.

Tuy nhiên, một số người thăm dò ý kiến phản đối biện pháp này, cho rằng khoảng tin cậy không áp dụng cho lấy mẫu hạn ngạch , đây là phương pháp được sử dụng bởi các viện bỏ phiếu ở Pháp. Vì lấy mẫu hạn ngạch chính thức là lấy mẫu không có xác suất, nên có một số sự thật đối với yêu cầu này. Nhưng vì lấy mẫu hạn ngạch là lấy mẫu phân tầng cơ bản , nên áp dụng khoảng tin cậy, phải không?

Tôi có thể hỏi kinh nghiệm về vấn đề này bên ngoài nước Pháp, ở các quốc gia nơi những người gây ô nhiễm cũng sử dụng lấy mẫu hạn ngạch không?


5
Lấy mẫu hạn ngạch khác với lấy mẫu phân tầng theo chính xác về khía cạnh này: không giống như lựa chọn trong mẫu phân tầng, việc thiếu tính ngẫu nhiên trong lấy mẫu hạn ngạch có nghĩa là chúng tôi không thể đảm bảo thiếu sai lệch. Vì vậy: có thể bạn không thể dựng CI để ước tính từ lấy mẫu hạn ngạch, nhưng bạn có thể thiết lập các khoảng cho độ lệch. Thật không may, ngoại trừ khi mẫu là một tỷ lệ đáng kể của dân số, độ lệch kéo dài từ gần -100% đến gần + 100%. Đây là lý do tại sao các mẫu hạn ngạch từ lâu đã bị mất uy tín ("Dewey đánh bại Truman", v.v.). Emptor caveat.
whuber

Những người thăm dò ý kiến ​​cho rằng việc lấy mẫu hạn ngạch, là tiêu chuẩn công nghiệp ở Pháp, cũng phổ biến ở Anh và các quốc gia Nam Âu. Tôi tự hỏi nếu Anh thực sự sử dụng lấy mẫu hạn ngạch, và tại sao lại sử dụng lấy mẫu hạn ngạch ở vị trí đầu tiên nếu sự thiên vị là không thể chấp nhận được?
Cha

1
@Fr Lấy mẫu hạn ngạch dễ thực hiện hơn so với lấy mẫu ngẫu nhiên: người thăm dò ý kiến ​​có thể chỉ định loại đối tượng nào cần thiết và số lượng người phỏng vấn, gửi người phỏng vấn ra đường với các hướng dẫn này và dễ dàng kiểm tra xem công việc đã được thực hiện đúng chưa: không cần để làm công việc khó khăn của việc thiết lập một khung lấy mẫu, vẽ một mẫu xác suất từ nó, săn lùng các thành viên của nó, đuổi theo nonrespondents, vv . Lấy mẫu hạn ngạch là một đứa trẻ áp phích sách giáo khoa cho các phương pháp lấy mẫu đã lỗi thời, đã biết: xem math.uah.edu/stat/data/1948Election.pdf chẳng hạn.
whuber

@whuber: Cảm ơn các chi tiết. Tôi biết về câu chuyện "Dewey đánh bại Truman". Tôi vẫn nghi ngờ rằng các viện bỏ phiếu của Anh thực sự đang sử dụng lấy mẫu hạn ngạch, như tuyên bố của tài liệu được trích dẫn trước đây, và sẽ phải kiểm tra. Sẽ rất thú vị khi biết các tiêu chuẩn ngành khác nhau trên các quốc gia lớn nhất là gì. Tôi biết một thực tế là hầu hết dữ liệu tôi tải xuống từ ICPSR là Quay số ngẫu nhiên.
Cha

1
Rất nhiều người không phải là chuyên gia (tức là những người không hiểu lý thuyết thống kê đằng sau việc lấy mẫu) đưa ra thuật ngữ "lấy mẫu hạn ngạch" mà không thực sự biết ý nghĩa của nó. Điều đó có thể giải thích cho tuyên bố rằng đó là thông lệ ở Anh và Nam Âu.
Abe

Câu trả lời:


6

Như whuber nói, câu trả lời ngắn gọn là các mẫu hạn ngạch là "con đẻ của các phương pháp lấy mẫu đã lỗi thời, đã biết xấu" và "từ lâu đã bị mất uy tín". Câu trả lời dài hơn là có thể có các điều kiện theo đó các mẫu "giống như hạn ngạch" có thể hoạt động tốt.

Phụ lục A ở đây là công việc gần đây về việc tái cấu trúc kết quả đại diện từ các bảng chọn tham gia Internet. Bài viết này đưa ra nền tảng thống kê cho phương pháp này. Để làm cho một câu chuyện dài ngắn, các sơ đồ lấy mẫu điển hình 1) vẽ một mẫu ngẫu nhiên, 2) cố gắng tuyển dụng các đối tượng và sau đó 3) thêm các trọng số sau phân tầng để bù cho sự khác biệt về người trả lời. Trong phương pháp chọn tham gia, bạn 1) tuyển dụng các đối tượng không ngẫu nhiên, 2) so sánh các câu trả lời với đường cơ sở đại diện và 3) thêm trọng số để bù cho sự khác biệt.

Về mặt thực tiễn, lấy mẫu chọn tham gia tương tự như lấy mẫu hạn ngạch, nhưng nền tảng thống kê được phát triển hơn. Ưu điểm là bạn có thể đưa ra yêu cầu về lấy mẫu đại diện, khoảng tin cậy, v.v ... Nhược điểm là yêu cầu của bạn dựa trên các giả định khó xác minh về cách mọi người tự chọn vào mẫu của bạn.

Rất nhiều người hoài nghi về các phương pháp này - chúng nghe có vẻ giống như lấy mẫu hạn ngạch. Nhưng một số bằng chứng cho thấy rằng lấy mẫu chọn tham gia có thể hoạt động tốt ít nhất một số thời gian. Vì vậy, bất chấp những tranh cãi, Polimetrix / YouGov (một người áp dụng sớm mô hình lấy mẫu chọn tham gia) dường như đang làm rất tốt. Trong số những thứ khác, họ đã thực hiện tất cả việc thu thập dữ liệu cho Nghiên cứu Bầu cử Quốc hội Hợp tác , một loạt các nghiên cứu bầu cử quốc gia gần đây của Hoa Kỳ.

(Tôi khá chắc chắn ICPSR mang dữ liệu này. Nếu không, dữ liệu khoa học xã hội của Harvard chắc chắn có. Rất nhiều học giả đang sử dụng dữ liệu từ các mẫu này.)

Dù sao, bạn đã hỏi về lấy mẫu hạn ngạch. Như bạn có thể thấy đã có trong luồng nhận xét ở đây, bất kỳ người thăm dò ý kiến ​​được đào tạo tốt nào cũng sẽ nói với bạn rằng lấy mẫu hạn ngạch là bunk. Ban giám khảo vẫn không tham gia lấy mẫu từ chối. Hiện tại, nếu bạn muốn rút ra khoảng tin cậy xung quanh các mẫu hạn ngạch, tôi muốn nói rằng các phương pháp này là đặt cược tốt nhất của bạn.


Cảm ơn các câu trả lời chi tiết. Tôi đã gắn cờ các điểm sau trong đó: (1) Lấy mẫu hạn ngạch được sử dụng để lấy mẫu Internet trong ví dụ của bạn. Trong bối cảnh đó, không có lý do để sử dụng nó qua lấy mẫu ngẫu nhiên thông qua RDD hoặc các kỹ thuật tương đương. (2) Ngay cả trong bối cảnh bạn mô tả, nó vẫn còn gây tranh cãi. Vì vậy, để quay trở lại câu hỏi của tôi, những người thăm dò ý kiến ​​của Pháp biện minh cho việc lấy mẫu hạn ngạch cho tất cả công việc của họ chỉ là ngớ ngẩn, hoặc không biết gì về lý thuyết lấy mẫu, hoặc cả hai.
Cha

"Những người thăm dò ý kiến ​​của Pháp biện minh cho việc lấy mẫu hạn ngạch cho tất cả các công việc của họ chỉ là ngớ ngẩn, hoặc không biết gì về lý thuyết lấy mẫu, hoặc cả hai." Âm thanh về đúng với tôi.
Abe

Chà, tôi đang kiểm tra "Đã trả lời" trên cái đó. Cảm ơn bạn đã dành thời gian và tham khảo chi tiết.
Cha

2
  1. Trong hầu hết các bối cảnh khảo sát không bắt buộc, có một vấn đề đáng kể với người không đáp ứng. Điều này từ năm 2002: "ước tính gần đây được báo cáo về tỷ lệ hợp tác khảo sát từ CMOR, Hội đồng Nghiên cứu Thị trường và Ý kiến ​​[Hoa Kỳ], trung bình chỉ 14,7%." và từ Paul Gerkeep, "Tôi tin rằng vẫn có thể vẽ các mẫu ngẫu nhiên. Tôi chỉ không tin rằng có thể thực hiện chúng." Trong bối cảnh này, thực tế là SAMPLE là ngẫu nhiên không liên quan lắm, vì dữ liệu kết quả là không.

  2. Điều này làm cho điều chỉnh sai lệch là vấn đề chính trong ước lượng hợp lệ và thiết kế phương pháp trường là một thành phần quan trọng. Những cách mà người ta có thể muốn làm điều này, và ước tính độ tin cậy kết quả, vượt xa những gì có thể được thảo luận ở đây.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.