Kết quả bầu cử Mỹ năm 2016: Điều gì đã xảy ra với các mô hình dự đoán?


108

Đầu tiên, đó là Brexit , giờ là cuộc bầu cử ở Mỹ. Nhiều dự đoán mô hình đã bị tắt bởi một biên độ rộng, và có bài học nào được học ở đây không? Cho đến tận 4 giờ chiều ngày hôm qua PST, các thị trường cá cược vẫn ủng hộ Hillary 4-1.

Tôi cho rằng các thị trường cá cược, với tiền thật trên đường dây, sẽ hoạt động như một nhóm gồm tất cả các mô hình dự đoán có sẵn ngoài kia. Vì vậy, sẽ không quá xa khi nói rằng những mô hình này đã không làm rất tốt.

Tôi thấy một lời giải thích là các cử tri không sẵn lòng nhận mình là người ủng hộ Trump. Làm thế nào một mô hình có thể kết hợp các hiệu ứng như vậy?

Một lời giải thích vĩ mô tôi đọc là sự trỗi dậy của chủ nghĩa dân túy . Câu hỏi sau đó là làm thế nào một mô hình thống kê có thể nắm bắt xu hướng vĩ mô như vậy?

Có phải những mô hình dự đoán ngoài kia đặt quá nhiều dữ liệu từ các cuộc thăm dò và tình cảm, không đủ từ nơi đất nước đang đứng trong tầm nhìn 100 năm? Tôi đang trích dẫn ý kiến ​​của một người bạn.


9
Làm thế nào để ước tính "không muốn tự nhận mình là người ủng hộ Trump". tác dụng: Có thể nhóm tập trung? Đây là một câu hỏi khoa học xã hội nhiều hơn số liệu thống kê mỗi se.
kjetil b halvorsen

100
Tại sao các mô hình phải sai chỉ vì họ dự đoán một kết quả không xảy ra? Tôi có một mô hình nói rằng một cái chết có lẽ sẽ không hiển thị sáu, nhưng đôi khi nó cho thấy một sáu dù sao.
DSaxton

4
Tôi không chắc chắn nếu các mô hình thực sự nghiêng về phía sai. Chúng ta đã đọc chính xác đầu ra của các mô hình chưa? Tôi cũng đồng ý với nhận xét của dsaxton.
Richard Hardy

7
Một số suy nghĩ tốt tại blog của Andrew Gelman ở đây .
Richard Hardy

22
Nếu tỷ lệ cược là 4: 1, kết quả ít phổ biến hơn vẫn sẽ xảy ra thường xuyên. Đó là thị trường cá cược cũng có thể đã đúng.
gung

Câu trả lời:


57

Nói tóm lại, bỏ phiếu không phải lúc nào cũng dễ dàng. Cuộc bầu cử này có thể là khó khăn nhất.

Bất cứ khi nào chúng tôi đang cố gắng thực hiện suy luận thống kê, một câu hỏi cơ bản là liệu mẫu của chúng tôi có phải là đại diện tốt cho dân số quan tâm hay không. Một giả định điển hình được yêu cầu cho nhiều loại suy luận thống kê là việc mẫu của chúng tôi là một mẫu hoàn toàn ngẫu nhiên từ dân số quan tâm (và thường, chúng tôi cũng cần các mẫu độc lập). Nếu những giả định này là đúng, chúng ta thường có các biện pháp tốt về sự không chắc chắn của chúng tôi dựa trên lý thuyết thống kê.

Nhưng chúng tôi chắc chắn không có những giả định này đúng với các cuộc thăm dò! Chúng tôi có chính xác 0 mẫu từ dân số quan tâm của chúng tôi: phiếu bầu thực tế tại ngày bầu cử. Trong trường hợp này, chúng tôi không thể thực hiện bất kỳ loại suy luận hợp lệ nào mà không cần thêm các giả định không thể kiểm chứng về dữ liệu. Hoặc ít nhất, không thể kiểm chứng cho đến sau ngày bầu cử.

Chúng ta có hoàn toàn từ bỏ và nói "50% -50%!"? Thông thường, không. Chúng ta có thể cố gắng làm cho những gì chúng ta tin là những giả định hợp lý về cách bỏ phiếu. Ví dụ, có thể chúng tôi muốn tin rằng các cuộc thăm dò là ước tính không thiên vị cho phiếu bầu trong ngày bầu cử, cộng với một số tiếng ồn tạm thời không thiên vị (nghĩa là phát triển dư luận khi thời gian trôi qua). Tôi không phải là chuyên gia về phương pháp bỏ phiếu, nhưng tôi tin rằng đây là loại mô hình 538 sử dụng. Và vào năm 2012, nó đã hoạt động khá tốt. Vì vậy, những giả định đó có lẽ khá hợp lý. Thật không may, không có cách nào thực sự để đánh giá những giả định đó, ngoài lý luận định tính nghiêm ngặt. Để thảo luận thêm về một chủ đề tương tự, xem chủ đề về sự mất tích không thể bỏ qua.

Lý thuyết của tôi về lý do tại sao các cuộc thăm dò đã làm rất kém trong năm 2016: các cuộc thăm dò không phải là ước tính không thiên vị về hành vi của cử tri. Đó là, tôi đoán rằng những người ủng hộ Trump (và có thể cả những người ủng hộ Brexit cũng vậy) đã mất lòng tin hơn nhiều đối với những người bỏ phiếu. Hãy nhớ rằng ông Trump đã tích cực tố cáo các cuộc thăm dò. Như vậy, tôi nghĩ những người ủng hộ Trump ít có khả năng báo cáo ý định bỏ phiếu của họ cho những người bỏ phiếu hơn là những người ủng hộ đối thủ của ông. Tôi sẽ suy đoán rằng điều này gây ra sự thiên vị nặng nề không lường trước trong các cuộc thăm dò.

Làm thế nào các nhà phân tích có thể tính đến điều này khi sử dụng dữ liệu thăm dò ý kiến? Chỉ dựa trên dữ liệu thăm dò ý kiến, không có cách nào thực sự để làm điều này một cách định lượng. Dữ liệu thăm dò ý kiến ​​không cho bạn biết bất cứ điều gì về những người không tham gia. Tuy nhiên, người ta có thể cải thiện các cuộc thăm dò theo cách định tính, bằng cách chọn các giả định hợp lý hơn (nhưng không thể kiểm chứng) về mối quan hệ giữa dữ liệu bỏ phiếu và hành vi trong ngày bầu cử. Điều này là không tầm thường và là phần thực sự khó khăn để trở thành một người bỏ phiếu tốt (lưu ý: Tôi không phải là người bỏ phiếu). Cũng lưu ý rằng kết quả cũng rất đáng ngạc nhiên đối với các học giả, vì vậy không giống như có những dấu hiệu rõ ràng cho thấy các giả định đã điên cuồng trong thời gian này.

Bỏ phiếu có thể khó khăn.


1
@horaceT: làm sao họ biết có sự thiên vị cho đến khi họ có mẫu từ dân số quan tâm? Một trong những nếp nhăn ở đây là trong lịch sử, tôi đoán rằng vấn đề này là một trong những tiếng ồn thay vì thiên vị . Nếu cả hai bên có mức độ không phản hồi bằng nhau, ước tính của bạn sẽ không thiên vị, chỉ hơi ồn hơn một chút. Nhưng kể từ khi ông Trump thực hiện một chiến dịch với quan điểm tiêu cực về các phương tiện truyền thông và các cuộc thăm dò ý kiến, nhiều hơn bất kỳ cuộc bầu cử nào trước đó, việc không có phản ứng có thể dễ dàng bị bỏ qua dưới sự đại diện của Trump. Đây sẽ là một hiệu ứng gây ô nhiễm sẽ có ...
Cliff AB

38
Đối với những gì nó có giá trị, tôi vẫn không nghĩ 538 thực sự thất bại. Nó đã mang lại cơ hội ~ 30% (?) Cho Trump chiến thắng, điều này khá tốt - điều đó có nghĩa là cứ sau 2-3 lần dự đoán là đúng, nó sẽ sai 1 lần. Đó là một lượng lớn sự không chắc chắn, nhiều hơn so với các cuộc thăm dò khác dường như sẵn sàng thừa nhận.
Mehrdad

3
Hiệu ứng này được biết đến nhiều: nó được gọi là hiệu ứng Bradley ở Mỹ và hiệu ứng Shy Tory ở Anh.
Emilio Pisanty

15
538 (và những thứ khác như PEC của Sam Wang) không bỏ phiếu. Họ là những mô hình được xây dựng từ kết quả thăm dò ý kiến. Tất cả các mô hình này bắt đầu với các dữ liệu cơ bản giống nhau, nhưng 538 dự đoán kết quả không chắc chắn hơn nhiều vì lý do Nate Silver đã thảo luận rộng rãi về bầu cử trước. Điều này có nghĩa là cơ hội 538 của một chiến thắng Hillary thấp hơn nhiều mặc dù nó đã sử dụng các cuộc thăm dò tương tự. Tôi đồng ý rằng 538 đã không thất bại - với đầu vào của nó, một chiến thắng Hillary với rất nhiều sự không chắc chắn có vẻ như là dự đoán tốt nhất ngay cả trong nhận thức muộn màng.
KAI

6
Lần đầu tiên tôi đọc dự đoán 538 cuối cùng vào buổi sáng sau cuộc bầu cử, và trong đó, Nate Silver nói rõ rằng tỷ lệ sai sót 3% sẽ nằm trong phạm vi thông thường - và nếu bạn nhìn vào biểu đồ của anh ta về tỷ lệ sai sót 3% có lợi cho Trump, nó phù hợp khá tốt với những gì thực sự đã xảy ra.
Xiong Chiamiov

35

Có một số nguồn gây lỗi bỏ phiếu:

  • Bạn thấy một số người khó tiếp cận

    Điều này được khắc phục bằng cách thực hiện phân tích nhân khẩu học, sau đó sửa cho sai lệch lấy mẫu của bạn. Nếu phân tích nhân khẩu học của bạn không phản ánh những điều khiến mọi người khó tiếp cận, việc điều chỉnh này sẽ không sửa chữa thiệt hại.

  • Mọi người nói dối

    Bạn có thể sử dụng tỷ lệ lịch sử mà mọi người nói dối với người gây ô nhiễm để ảnh hưởng đến mô hình của bạn. Một ví dụ, trong lịch sử mọi người nói rằng họ sẽ bỏ phiếu cho bên thứ 3 nhiều hơn so với thực tế họ làm trong ngày bầu cử. Sửa chữa của bạn có thể sai ở đây.

    Những lời nói dối này cũng có thể làm rối tung những sửa chữa khác của bạn; nếu họ nói dối về việc bỏ phiếu trong cuộc bầu cử vừa qua, họ có thể được tính là cử tri có khả năng ngay cả khi họ không, chẳng hạn.

  • Chỉ những người bỏ phiếu cuối cùng mới đếm

    Ai đó có thể có rất nhiều hỗ trợ, nhưng nếu những người ủng hộ của họ không xuất hiện vào ngày bầu cử, thì điều đó không được tính. Đây là lý do tại sao chúng tôi đã đăng ký cử tri, các mô hình cử tri, vv. Nếu những mô hình này sai, mọi thứ không hoạt động.

  • Bỏ phiếu tốn tiền

    Làm các cuộc thăm dò là tốn kém, và nếu bạn không mong đợi (giả sử) Michigan lật bạn có thể không thăm dò ý kiến ​​thường xuyên. Điều này có thể dẫn đến ngạc nhiên khi một tiểu bang mà bạn đã bỏ phiếu 3 tuần trước cuộc bầu cử trông không giống như thế vào ngày bầu cử.

  • Mọi người thay đổi suy nghĩ

    Trong vài phút, giờ, ngày, tuần hoặc tháng, mọi người thay đổi suy nghĩ của họ. Thăm dò ý kiến ​​về "những gì bạn sẽ làm bây giờ" không giúp ích nhiều nếu họ thay đổi suy nghĩ trước khi nó được tính. Có những mô hình đoán gần đúng tốc độ mọi người thay đổi suy nghĩ dựa trên các cuộc thăm dò lịch sử.

  • Chăn gia súc

    Nếu mọi người khác nói rằng Hillary là +3 và bạn nhận được một cuộc thăm dò cho thấy Hillary +11 hoặc Donald +1, bạn có thể đặt câu hỏi. Bạn có thể thực hiện một lần nữa và xem nếu có một thất bại phân tích. Bạn thậm chí có thể ném nó ra và làm một cuộc thăm dò khác. Khi bạn nhận được một cuộc thăm dò Hillary +2 hoặc +4, bạn có thể không làm điều đó. Các ngoại lệ lớn, ngay cả khi mô hình thống kê nói rằng điều đó đôi khi xảy ra, có thể khiến bạn "trông tệ".

    Một hình thức đặc biệt nhảm nhí này đã xảy ra vào ngày bầu cử, nơi tất cả những người phát hành một cuộc thăm dò kỳ diệu đều hội tụ đến cùng một giá trị; họ có thể là nơi các cuộc thăm dò ngoại lệ, nhưng không ai muốn trở thành người nói (nói) Hillary +11 một ngày trước cuộc bầu cử này. Bị sai trong một đàn làm tổn thương bạn ít hơn.

  • Lỗi lấy mẫu dự kiến

    Nếu bạn có 1 triệu người và bạn hỏi 100 người hoàn toàn ngẫu nhiên và một nửa nói "Apple" và một nửa nói "Orange", lỗi dự kiến ​​bạn nhận được từ việc lấy mẫu là +/- 10 hoặc hơn, ngay cả khi không có vấn đề nào ở trên xảy ra Bit cuối cùng này là những gì các cuộc thăm dò mô tả như là lỗi của họ . Các cuộc thăm dò hiếm khi mô tả những gì các yếu tố điều chỉnh ở trên có thể giới thiệu là lỗi.


Nate Silver ở 538 là một trong số ít các công cụ tổng hợp bỏ phiếu sử dụng phương pháp bảo thủ (thận trọng) để xử lý khả năng xảy ra các loại lỗi trên. Ông chú ý đến khả năng xảy ra lỗi tương quan hệ thống trong các mô hình bỏ phiếu.

Trong khi các nhà tổng hợp khác dự đoán tỷ lệ HC 90% + đã được bầu, thì Nate Silver đã tuyên bố 70%, vì các cuộc thăm dò nằm trong "lỗi bỏ phiếu bình thường" trong chiến thắng của Donald.

Đây là một thước đo lịch sử của lỗi mô hình , trái ngược với lỗi lấy mẫu thống kê thô; Điều gì xảy ra nếu mô hình và các chỉnh sửa cho mô hình bị sai?


Mọi người vẫn đang giòn giã những con số. Nhưng, kết quả sơ bộ cho thấy một phần lớn của nó là các mô hình bỏ đi. Những người ủng hộ Donald cho thấy các cuộc thăm dò với số lượng lớn hơn và những người ủng hộ Hillary với số lượng ít hơn so với các mô hình bỏ phiếu (và các cuộc thăm dò ý kiến!) Chỉ ra.

Latino đã bầu chọn cho Donald nhiều hơn dự kiến. Người da đen đã bỏ phiếu cho Donald nhiều hơn dự kiến. (Hầu hết cả hai đều bỏ phiếu cho Hillary). Phụ nữ da trắng đã bỏ phiếu cho Donald nhiều hơn dự kiến ​​(nhiều người trong số họ đã bầu cho Donald hơn Hillary, điều không được mong đợi).

Tỷ lệ cử tri bỏ phiếu nói chung là thấp. Đảng Dân chủ có xu hướng giành chiến thắng khi có tỷ lệ cử tri đi bầu cao, và đảng Cộng hòa khi có mức thấp.


1
Một vấn đề thú vị của Turnout là cuộc thăm dò ý kiến ​​ảnh hưởng đến kết quả bỏ phiếu. Có một mô hình bỏ đi cho điều đó? Có thể có một chức năng lấy kết quả dự đoán khảo sát và sửa đổi nó cho cả hai bên theo triển vọng của ứng viên. Một ứng cử viên ở xa có thể không nhận được thêm cử tri, những người quan tâm hơn sau khi xem cuộc thăm dò mô tả triển vọng của ứng cử viên của họ là rất thảm khốc, nhưng nếu ứng cử viên của bạn tiến xa, bạn có thể không nỗ lực để bỏ phiếu ... Rõ ràng đó không phải là một chức năng tuyến tính, nhưng nó cần được đo lường.
BenPen

2
+1 từ tôi chỉ để đề cập đến việc chăn gia súc và giải thích nó tốt. Khi tôi đi qua câu trả lời của mình, tôi đã rất nghi ngờ việc chăn gia súc có thể xảy ra bắt đầu vào khoảng ngày 5 hoặc hơn (3 ngày kể từ cuộc bầu cử) dựa trên biểu đồ 538. Tôi đoán chúng ta sẽ tìm hiểu thêm về những lỗi thực sự trong những ngày sắp tới. (Bạn biết bạn là một mọt sách khi bạn làm mới một cách ám ảnh một trang web để chiêm ngưỡng đạo hàm thứ hai của một đường cong đồ thị ở đó).
TED

Tôi không biết bạn giải thích như thế nào, nhưng tôi nghĩ rằng có một sự kỳ thị liên quan đến Trump sẽ khiến cho việc định lượng chính xác sự hỗ trợ thực sự của anh ấy và sẽ chỉ hiển thị trong kết quả bầu cử thực sự. Tôi thích nghĩ về nó như là một hệ quả của nhãn dán bội Có một số ứng cử viên nhất định trong đó hỗ trợ mở thu hút quá nhiều nhiệt và vitriol từ phe đối lập và sự hỗ trợ là rất thấp.
coburne

3
@coburne Không có bằng chứng về điều đó trong các cuộc bầu cử sơ bộ; Trump ủng hộ nơi không ngại ngùng về nó. Nhãn dán bội Bush nơi phổ biến ở các khu vực khác nhau hơn nhãn dán bội Obama.
Yakk

@coburne - Những gì bạn đang nói về được gọi là Hiệu ứng Bradley . Có một cuộc tranh luận lớn về việc nó thậm chí còn tồn tại. Có một nghiên cứu mặc dù được cho là đã tìm thấy sức mạnh của nó tỷ lệ thuận với mức độ hùng biện mang tính phân biệt chủng tộc được sử dụng trong chiến dịch. Tôi không nghĩ có nhiều tranh luận rằng nhiều thứ đã được sử dụng trong cái này.
TED

31

Điều này đã được đề cập trong các ý kiến ​​về câu trả lời được chấp nhận (hat-tip cho Mehrdad ), nhưng tôi nghĩ nó nên được nhấn mạnh. 538 thực sự đã làm điều này khá tốt trong chu kỳ này * .

538 là một công cụ tổng hợp bỏ phiếu chạy các mô hình theo từng tiểu bang để cố gắng dự đoán người chiến thắng. Cuộc chạy đua cuối cùng của họ đã mang lại cho Trump khoảng 30% cơ hội chiến thắng. Điều đó có nghĩa là nếu bạn thực hiện ba cuộc bầu cử với dữ liệu như thế này, bạn sẽ mong đợi Đội Đỏ giành được một trong số đó. Đó thực sự không phải là một cơ hội nhỏ. Nó chắc chắn là một cái đủ lớn mà tôi đã đề phòng (ví dụ: Thứ Sáu trước khi tôi yêu cầu thứ Tư ngày 9 nghỉ làm, xem xét khả năng nó đủ gần để trở thành một đêm muộn).

Một điều 538 sẽ cho bạn biết nếu bạn đi chơi ở đó là nếu các cuộc thăm dò bị tắt, rất có thể tất cả họ sẽ đi theo cùng một hướng. Điều này là vì một vài lý do.

  • Mô hình cử tri có khả năng. Các cuộc thăm dò phải điều chỉnh cho các loại cử tri sẽ thực sự xuất hiện vào ngày bầu cử. Chúng tôi có các mô hình lịch sử, nhưng đây rõ ràng không phải là cặp ứng cử viên điển hình của bạn, vì vậy dự đoán dựa trên dữ liệu trong quá khứ luôn luôn là một chút khó khăn.
  • Chăn gia súc muộn . Không ai muốn trở thành cuộc thăm dò ý kiến ​​tồi tệ nhất. Vì vậy, trong khi họ không bận tâm đến việc trở thành một ngoại lệ ở giữa chiến dịch, cuối cùng, tất cả các cuộc thăm dò có xu hướng tự điều chỉnh để họ nói điều tương tự. Đây là một trong những điều bị đổ lỗi cho các cuộc thăm dò ý kiến ​​rất nghiêm trọng về sự mất mát bất ngờ của Eric Cantor vào năm 2014, và cho kết quả gần như đáng ngạc nhiên của cuộc đua Thượng viện Virginia 2014 .

* - 538 hiện đã đăng phân tích của riêng họ . Nó chủ yếu là jibes với những gì được nói ở trên, nhưng đáng đọc nếu bạn muốn biết thêm chi tiết.


Bây giờ một chút suy đoán cá nhân. Tôi thực sự hoài nghi về% cơ hội cuối cùng của 538 trong 3 ngày qua. Lý do quay trở lại viên đạn thứ hai ở trên. Hãy xem lịch sử mô hình của họ cho cuộc bầu cử này (từ trang web của họ)

nhập mô tả hình ảnh ở đây

(Đáng buồn thay, các nhãn che khuất nó, nhưng sau đó, các đường cong đã chuyển hướng một lần nữa trong ba ngày qua, tạo ra cơ hội hơn 70% cho bà Clinton)

Mô hình mà chúng ta thấy ở đây là sự phân kỳ lặp đi lặp lại sau đó là sự phân rã trở lại đối với một người lãnh đạo Trump. Bong bóng Clinton đều do các sự kiện gây ra. Đầu tiên là các quy ước (thông thường sẽ có một vài ngày trễ sau một sự kiện để nó bắt đầu hiển thị trong cuộc bỏ phiếu). Thứ hai dường như đã được khởi động bởi cuộc tranh luận đầu tiên, có khả năng được giúp đỡ cùng với băng TMZ. Sau đó, có điểm uốn thứ ba tôi đã đánh dấu trong hình.

Nó đã xảy ra vào ngày 5 tháng 11, 3 ngày trước cuộc bầu cử. Sự kiện nào gây ra điều này? Một vài ngày trước đó là một vụ bùng phát email khác, nhưng điều đó không nên có lợi cho bà Clinton.

Giải thích tốt nhất tôi có thể đưa ra tại thời điểm đó là chăn gia súc. Chỉ còn 3 ngày nữa là đến ngày bầu cử, 2 ngày cho đến khi các cuộc thăm dò cuối cùng, và những người bỏ phiếu sẽ bắt đầu lo lắng về kết quả cuối cùng của họ. "Sự khôn ngoan thông thường" trong toàn bộ cuộc bầu cử này (bằng chứng là các mô hình cá cược) là một chiến thắng dễ dàng của bà Clinton. Vì vậy, có vẻ như một khả năng khác biệt rằng đây hoàn toàn không phải là một sự thay đổi. Nếu đó là trường hợp, đường cong thực sự từ ngày 5 tháng 11 trở đi rất có thể là sự tiếp nối của điều này theo hướng hội tụ.

Sẽ cần một nhà toán học giỏi hơn tôi để ước tính đường cong về phía trước mà không có điểm uốn cuối cùng đáng ngờ này, nhưng tôi nghĩ rằng ngày 8 tháng 11 sẽ ở gần điểm giao nhau . Ở phía trước hay phía sau phụ thuộc vào bao nhiêu đường cong đó là thật.

Bây giờ tôi không thể nói chắc chắn đây là những gì đã xảy ra. Có những lời giải thích rất hợp lý khác (ví dụ: Trump đã đưa ra các cử tri của mình tốt hơn nhiều so với bất kỳ cuộc thăm dò ý kiến ​​nào) Nhưng đó là lý thuyết của tôi cho những gì đang diễn ra vào thời điểm đó, và nó chắc chắn đã chứng minh được dự đoán.


1
Tôi nghĩ rằng sự thay đổi cuộc thăm dò kỳ lạ này trong vài ngày qua sẽ được phân tích tốt hơn, nhưng những người ủng hộ bà Clinton đã nhìn thấy những gì họ muốn thấy, và những người ủng hộ Trump từ lâu đã bỏ qua các cuộc thăm dò. Hy vọng ai đó sẽ làm điều đó bây giờ.
TED

Tôi nghĩ rằng những ngày cuối cùng bình thường hóa một chút do tuyên bố của Comey rằng các email mới không cấu thành nguyên nhân cho điều tra hình sự mới.
Konrad Rudolph

@KonradRudolph - Đó là lời giải thích mà tôi nghe được đưa ra cho sự thay đổi đó vào thời điểm đó. Vấn đề là tuyên bố trong câu hỏi đã không được đưa ra cho đến ngày 6 tháng 11, và điểm lạm phát bỏ phiếu đáng ngờ đã xảy ra một ngày trước đó (xem điểm đánh dấu trong hình trên). Ngoài ra, thời điểm là sai đối với sự sụt giảm hoàn toàn được giải thích bởi Comey, vì vậy không có lý do hợp lý nào để tuyên bố "không bao giờ" của anh ta sẽ dừng lại (ít quay vòng hơn).
TED

2
Vấn đề với 538 không phải là mô hình của họ nhiều như chất lượng của dữ liệu bỏ phiếu đi vào nó. Dữ liệu làm rõ rằng đây không phải là một trường hợp lỗi lấy mẫu (khá nhỏ khi bạn bình chọn trung bình mà mỗi cuộc thăm dò có cỡ mẫu khá). washparkprophet.blogspot.com/2016/11/what-polls-got-wrong.html Thay vào đó, vấn đề là một trong hai mẫu thiên vị trong phần lớn nhất của các cuộc thăm dò, hoặc hệ thống sự thiếu thành thật từ trả lời cuộc thăm dò (do không chấp thuận xã hội của Trump) hoặc cả hai. Nhưng, 538 nhận được danh tiếng khi nhận ra trong mô hình của họ rằng các cuộc thăm dò ở các quốc gia khác nhau không độc lập.
ohwilleke

@ohwilleke - Phải rồi. Như một trong những câu trả lời khác đã nói, GIGO. Đó là những gì tôi nghĩ có khả năng xảy ra với điểm uốn cong kỳ lạ không giải thích được. Câu hỏi là nguồn gốc của "rác" trong các cuộc thăm dò đầu vào.
TED

17

Đầu tiên, đó là Brexit, bây giờ là cuộc bầu cử ở Mỹ

Không thực sự là lần đầu tiên, ví dụ như cuộc bầu cử tổng thống Pháp, 2002 "đã dẫn đến các cuộc thảo luận nghiêm túc về kỹ thuật bỏ phiếu".

Vì vậy, sẽ không quá xa khi nói rằng những mô hình này đã không làm rất tốt.

Rác vào, rác ra.

Tôi thấy một lời giải thích là các cử tri không sẵn lòng nhận mình là người ủng hộ Trump. Làm thế nào một mô hình có thể kết hợp các hiệu ứng như vậy?

Xem phản ứng thiên vị , và đặc biệt là thiên vị mong muốn xã hội . Đọc thú vị khác: phần lớn im lặnghiệu ứng Bradley .


2
Chắc chắn, rác trong rác ra. Nhưng làm thế nào để người ta nhận ra các yếu tố dự đoán là rác và thực hiện "lựa chọn biến" để có được chúng?
horaceT

6
@horaceT như bạn thấy, điều này rất khó và đôi khi có thể là không thể. FiveThentyEight.com có phương pháp rất tốt và mô hình chất lượng cao, sử dụng dữ liệu đa dạng và sửa lỗi cho nhiều sai lệch. Một ngày trước cuộc bầu cử, nó đã đưa ra xác suất 71,4% rằng Hilary Clinton sẽ giành chiến thắng ...
Tim

1
@horaceT Tôi sẽ tập trung vào việc thu thập dữ liệu, vì đó dường như là vấn đề. Trang thiên vị mong muốn xã hội chứa một số ý tưởng để cải thiện nó.
Franck Dernoncourt

1
@horaceT hơn nữa, nếu hầu hết mọi nhóm nói rằng bà Clinton chỉ dẫn một người điên sẽ lập luận rằng tất cả họ đều sai ... Sẽ rất khó để biện minh cho mô hình như vậy.
Tim

1
Tôi sẽ tò mò muốn biết dự đoán của các cuộc thăm dò chính xác như thế nào đối với tỷ lệ cử tri đi bầu (ví dụ dựa trên nhân khẩu học). Tôi có thể tưởng tượng rằng nếu nhiều cuộc thăm dò dự đoán một "khách hàng tiềm năng quan trọng", thì việc bỏ phiếu có thể bị triệt tiêu (ví dụ như hiệu ứng người quan sát )?
GeoMatt22

12

Cuộc thăm dò của USC / LA Times có một số con số chính xác. Họ dự đoán Trump sẽ dẫn đầu. Xem cuộc thăm dò của USC / LA Times đã thấy những điều mà các cuộc khảo sát khác đã bỏ lỡ: Một làn sóng ủng hộ Trump

http://www.latimes.com/polencies/la-na-pol-usc-latimes-poll-20161108-story.html

nhập mô tả hình ảnh ở đây

Họ đã có con số chính xác cho năm 2012 là tốt.

Bạn có thể muốn xem lại: http://graphics.latimes.com/usc-presquil-poll-dashboard/

Và NY Times đã phàn nàn về trọng số của họ: http://www.nytimes.com/2016/10/13/upshot/how-one-19-year-old-illinois-man-is-distorting-national-polling-a Average. html

Phản hồi của LA Times: http://www.latimes.com/polencies/la-na-pol-daybreak-poll-questions-20161013-snap-story.html


26
Cuộc thăm dò ý kiến ​​này đã khiến Trump giành được số phiếu phổ biến 3,2%, nhưng dường như bà Clinton đã giành được .1%. Vì vậy, tôi không thấy làm thế nào bạn có thể nói họ có số chính xác.
Winston Ewert

3
Chỉ cần một lưu ý nhỏ - bạn có thực sự mong đợi bất kỳ số liệu thống kê nào nằm trong phạm vi dưới 3,2% của một cửa sổ lỗi không?
AnoE

9
Các vấn đề với cuộc thăm dò này là một ví dụ là 1) Việc bỏ phiếu sai. Bỏ phiếu phổ biến có tương quan với việc giành chức Chủ tịch, nhưng đó không phải là quyết định của nó. 2) Nó có topline sai . Clinton đã giành được những gì nó đang đo, không phải Trump. 3) Nó bị loại bỏ bởi 3 điểm giống nhau, hầu hết các cuộc thăm dò khác, chỉ theo một hướng khác.
TED

5
... thực ra, có vẻ như bà Clinton có thể kết thúc về điểm toàn diện trước Trump trong cuộc bỏ phiếu phổ biến, điều đó có nghĩa là cuộc thăm dò ý kiến ​​này đã bị loại bỏ 4, chứ không phải 3. Vì vậy, về mặt lý thuyết, một cuộc thăm dò tương tự giúp bà giành được 3 điểm sẽ có được gấp đôi chính xác như cái này (off bởi chỉ có 2 điểm chứ không phải là 4).
TED

8
Cuộc thăm dò của LA Times là chính xác một cách tình cờ : người 19 tuổi quá cân đối trọng với phiếu bầu nông thôn trắng quá cân.
Đánh dấu

11

Không có đất cao tuyên bố ở đây. Tôi làm việc trong một lĩnh vực (Giám sát và Đánh giá) đầy rẫy với khoa học giả như bất kỳ khoa học xã hội nào khác mà bạn có thể đặt tên.

Nhưng đây là thỏa thuận, ngành công nghiệp bỏ phiếu được cho là đang gặp 'khủng hoảng' vì ngày nay, dự đoán bầu cử của Mỹ rất sai, khoa học xã hội nói chung có một 'khủng hoảng' có thể lặp lại và vào cuối những năm 2000, chúng ta đã có một 'khủng hoảng' tài chính thế giới bởi vì một số học viên tin rằng các công cụ phái sinh thế chấp dưới gốc là một dạng dữ liệu tài chính hợp lệ (nếu chúng tôi cho họ lợi ích của sự nghi ngờ ...).

Và tất cả chúng ta chỉ sai lầm về bất kể. Hàng ngày tôi thấy các cấu trúc nhà nghiên cứu đáng nghi ngờ nhất được sử dụng làm phương pháp thu thập dữ liệu, và do đó cuối cùng được sử dụng làm dữ liệu (mọi thứ từ thang đo bán chuẩn cho đến các loại phản ứng cố định hoàn toàn hàng đầu). Rất ít nhà nghiên cứu thậm chí dường như nhận ra rằng họ cần phải có một khung khái niệm cho các cấu trúc như vậy trước khi họ có thể hy vọng hiểu được kết quả của họ. Như thể chúng ta đã xem xét các phương pháp 'nghiên cứu' thị trường và quyết định chỉ chấp nhận những sai lầm tồi tệ nhất của họ, với việc bổ sung một số ít ở bên cạnh.

Chúng tôi muốn được coi là 'nhà khoa học', nhưng sự nghiêm khắc hơi khó để làm phiền, vì vậy chúng tôi thu thập dữ liệu rác rưởi và cầu nguyện với vị thần thống kê giống như Loki để vượt qua tiên đề của GIGO.

Nhưng như lời ông Feynman trích dẫn nặng nề chỉ ra:

Không quan trọng lý thuyết của bạn đẹp như thế nào, không quan trọng bạn thông minh đến mức nào. Nếu nó không đồng ý với thử nghiệm, thì đó là sai.

Có nhiều cách tốt hơn để xử lý dữ liệu định tính mà chúng ta thường bị mắc kẹt, nhưng chúng tốn nhiều công sức hơn và những cấu trúc nhà nghiên cứu tốt đẹp đó thường dễ dàng hơn để đưa vào SPSS. Sự tiện lợi dường như thổi phồng khoa học mọi lúc (không có ý định chơi chữ).

Nói tóm lại, nếu chúng ta không bắt đầu nghiêm túc về chất lượng dữ liệu thô, tôi nghĩ rằng chúng ta đang lãng phí thời gian và tiền bạc của mọi người, bao gồm cả chính chúng ta. Vì vậy, có ai muốn hợp tác trong một "sáng kiến ​​chất lượng dữ liệu" liên quan đến các phương pháp khoa học xã hội (vâng, có rất nhiều trong sách giáo khoa về những điều đó, nhưng dường như không ai chú ý đến nguồn đó sau kỳ thi của họ).

Bất cứ ai có gravitas học thuật nhất sẽ được dẫn đầu! (Nó sẽ không phải là tôi.)

Chỉ cần nói rõ về câu trả lời của tôi ở đây: Tôi thấy các vấn đề cơ bản nghiêm trọng với các kiểu dữ liệu thô 'bị chiếm đoạt' thường xuyên đến mức tôi muốn đề xuất một sự cần thiết phải bắt đầu ngay từ đầu. Vì vậy, ngay cả trước khi chúng tôi lo lắng về việc lấy mẫu hoặc kiểm tra dữ liệu nào để chạy trên dữ liệu, chúng tôi cần xem xét tính hợp lệ / giới hạn của các loại dữ liệu chúng tôi thu thập liên quan đến các mô hình mà chúng tôi đang đề xuất. Mặt khác, mô hình dự đoán tổng thể được xác định không đầy đủ.


2
Mất rất xa Tôi chắc chắn, bạn có thể đưa ra ví dụ về các cấu trúc nhà nghiên cứu nghi vấn.
horaceT

4
Tôi không nhất thiết không đồng ý với nhiều điểm của bạn. Nhưng tôi chỉ muốn chỉ ra rằng trong trường hợp bỏ phiếu, tôi nghĩ mọi người bỏ phiếu đều cực kỳ nhận thức được những hạn chế do chất lượng dữ liệu, nhưng thực sự không có lựa chọn nào để cải thiện nó (xem câu trả lời của tôi). Câu trả lời của bạn dường như gợi ý rằng những người thăm dò ý kiến ​​muốn đưa ra bất kỳ câu trả lời nào , không quan tâm đến chất lượng dữ liệu. Tôi nghĩ rằng người thăm dò quan tâm rất nhiều về chất lượng dữ liệu, nhưng cũng nhận ra rằng điều tốt nhất họ có thể nhận được có những sai sót nghiêm trọng. Bạn có từ bỏ ("50% -50%!") Hoặc cố gắng xây dựng một cái gì đó thể hợp lý?
Vách đá AB

Phản hồi của tôi đối với các bình luận nhất thiết phải hơi dài, vì vậy đã thêm nó vào như một câu trả lời mới
colin

9

Các cuộc thăm dò có xu hướng có tỷ lệ lỗi 5% mà bạn thực sự không thể thoát khỏi, bởi vì đó không phải là một lỗi ngẫu nhiên, mà là sai lệch. Ngay cả khi bạn trung bình trên nhiều cuộc thăm dò, nó sẽ không tốt hơn nhiều. Điều này có liên quan đến các nhóm cử tri trình bày sai, thiếu huy động, không có khả năng đi bỏ phiếu vào ngày làm việc, không sẵn lòng trả lời, không sẵn lòng trả lời các quyết định đúng , tự phát vào phút cuối, ... bởi vì sự thiên vị này có xu hướng "tương quan" trên các cuộc thăm dò, bạn không thể thoát khỏi nó với nhiều cuộc thăm dò hơn; bạn cũng không thể loại bỏ nó với kích thước mẫu lớn hơn; và bạn dường như cũng không thể dự đoán được sự thiên vị này, bởi vì nó thay đổi quá nhanh (và chúng tôi bầu các tổng thống quá hiếm khi).

Do nguyên tắc thắng tất cả ngu ngốc vẫn xuất hiện ở hầu hết các bang, sai số 5% có thể gây ra kết quả rất khác nhau: Giả sử các cuộc thăm dò luôn dự đoán 49-51, nhưng kết quả thực sự là 51-49 (vì vậy lỗi là chỉ 2%), kết quả giảm 100%; bởi vì người chiến thắng-mất-tất cả

Nếu bạn nhìn vào các trạng thái riêng lẻ, hầu hết các kết quả nằm trong phạm vi lỗi dự đoán!

Có lẽ cách tốt nhất bạn có thể làm là lấy mẫu độ lệch này (+ -5%), áp dụng các cực trị thắng-thua-tất cả, sau đó tổng hợp các kết quả. Điều này có lẽ tương tự như những gì 538 đã làm; và trong 30% số mẫu Donald Trump giành được ...


9
Tôi gọi đây là "nguyên tắc rìa mất trí" của bỏ phiếu: trong bất kỳ câu hỏi khảo sát nào, 5% số người được hỏi sẽ đưa ra một câu trả lời điên rồ. Giống như bất kỳ nguyên tắc thực nghiệm nào, nó có ngoại lệ, nhưng nó đã đứng vững trong nhiều thập kỷ trong việc giúp làm cho ý nghĩa của kết quả thăm dò ý kiến.
whuber

1
Nếu nó chỉ là chỉ một "phát điên" câu trả lời. Vấn đề là nó có hệ thống chứ không phải "điên ngẫu nhiên". Bạn có thể coi cuộc bầu cử là một cuộc thăm dò nhị phân, và "câu trả lời điên rồ" nào bạn có thể mong đợi ở nhị phân? Nhưng rõ ràng, rất nhiều người cố tình (?) Đưa ra một câu trả lời sai hoặc quyết định khác nhau khi thực sự ở trong gian hàng, hoặc sau đó không đi đến các cuộc bầu cử, ...
Anony-Mousse

3
@ Anony-Mousse cho dù nó có chính xác hay không, tôi không thấy cách gọi tên tuổi vị thành niên có liên quan đến phân tích thống kê.
Jared Smith

Ồ, đó là một câu chuyện vô giá. Vào một số ngày, bạn phải cười, thay vì lo lắng tại sao kết quả dự đoán là không chính xác.
Anony-Mousse

Bình luận không dành cho thảo luận mở rộng; cuộc trò chuyện này đã được chuyển sang trò chuyện .
gung

7

Sự phụ thuộc vào phân tích dữ liệu có tác động rất lớn trong các quyết định chiến dịch chiến lược, đưa tin , và cuối cùng là trong các lựa chọn cá nhân. Điều gì có thể xảy ra khi các quyết định của chiến dịch Clinton được thông báo bởi không phải ai khác ngoài mô phỏng hàng ngày về thuật toán Ada bí mật ?400,000

Cuối cùng, nó đã bộc lộ một thất bại khổng lồ của phân tích số để bù đắp cho sự thiếu hiểu biết về vấn đề này. Mọi người xấu hổ về bản thân để nắm lấy ứng cử viên chiến thắng một cách rõ ràng vì những lý do rõ ràng.

Mô hình máy tính tồi tệ nhất có thể đã tiến gần hơn đến kết quả nếu có ai đó thực hiện một cuộc thăm dò sơ bộ trực diện, gõ cửa. Dưới đây là một ví dụ: Tập đoàn Trafalgar (không có liên kết hay kiến ​​thức nào khác ngoài những gì tiếp theo) có Trump dẫn đầu ở PA, FL, MI, GA, UT và NV (trạng thái sau này cuối cùng đã chuyển sang màu xanh) một ngày trước cuộc bầu cử. Phép thuật là gì?

một sự kết hợp của những người trả lời khảo sát cho cả bài kiểm tra lá phiếu tiêu chuẩn và bài kiểm tra lá phiếu [sic] nơi hàng xóm của người trả lời đứng. Điều này giải quyết sự thiên vị cơ bản của bỏ phiếu truyền thống, trong đó người trả lời không hoàn toàn trung thực về vị trí của họ đối với các ứng cử viên gây tranh cãi cao.

Công nghệ khá thấp, bao gồm việc thiếu kiểm tra chính tả, thể hiện rất nhiều về bản chất con người. Đây là sự khác biệt trong PA :

nhập mô tả hình ảnh ở đây

Pennsylvania lịch sử - cho đến nay được coi là rơm cuối cùng trong thất bại Dân chủ chỉ vài giờ trước khi nhận ra kết thúc này lúc 1:40 sáng ngày 9 tháng 11 năm 2016:

nhập mô tả hình ảnh ở đây


2
Hỏi về ý định bỏ phiếu của hàng xóm là tuyệt vời - đối với tôi, một trong những mánh khóe thông minh đó đôi khi được sử dụng trong Thống kê, cho phép sửa (ít nhất là ở một mức độ nào đó) cho sự thiên vị dường như vô vọng. Cảm ơn đã viết về điều đó, rất thú vị!
DeltaIV

5

Một trong những lý do cho sự không chính xác của cuộc bầu cử trong cuộc bầu cử ở Hoa Kỳ, bên cạnh một số người vì bất kỳ lý do gì don dont nói sự thật là, hiệu ứng "người chiến thắng có tất cả" khiến cho việc dự đoán trở nên dễ dàng hơn. Chênh lệch 1% ở một trạng thái có thể dẫn đến sự thay đổi hoàn toàn trạng thái và ảnh hưởng đến toàn bộ kết quả rất nặng nề. Hillary có nhiều cử tri giống như Al Gore vs Bush.

Cuộc trưng cầu dân ý về Brexit không phải là một cuộc bầu cử bình thường và do đó cũng khó dự đoán hơn (Không có dữ liệu lịch sử tốt và mọi người giống như một cử tri lần đầu tiên về vấn đề này). Những người trong nhiều thập kỷ bỏ phiếu cho cùng một đảng ổn định dự đoán.


2
Quan sát rất tốt. Có các trạng thái rõ ràng cho mỗi bên và trạng thái swing. Trong khi số lượng của họ thấp, ảnh hưởng đến một thay đổi nhỏ có số lượng phiếu bầu lớn. Đó là một chương trình bỏ phiếu rất phát triển trong lịch sử ở Mỹ.
Trilarion

4

(Chỉ cần trả lời bit này, vì các câu trả lời khác dường như đã bao gồm mọi thứ khác.)

Cho đến tận 4 giờ chiều ngày hôm qua PST, các thị trường cá cược vẫn ủng hộ Hillary 4 đến 1. Tôi cho rằng thị trường cá cược, với tiền thật trên đường dây, sẽ hoạt động như một tập hợp của tất cả các mô hình dự đoán có sẵn ngoài kia.

Không ... nhưng gián tiếp là có.

Các thị trường cá cược được thiết kế để các nhà cái kiếm được lợi nhuận bất cứ điều gì xảy ra. Ví dụ, tỷ lệ cược hiện tại được trích dẫn là 1-4 trên Hilary và 3-1 đối với Trump. Nếu tất cả mười người tiếp theo đặt cược 10 đô la vào Hilary, thì 100 đô la đó sẽ được trả cho họ 25 đô la nếu Hilary thắng. Vì vậy, họ rút ngắn Hilary xuống còn 1-5 và nâng Trump lên 4-1. Ngày càng có nhiều người đặt cược vào Trump, và sự cân bằng được khôi phục. Tức là nó hoàn toàn dựa trên cách mọi người đặt cược, không dựa trên các học giả hay các mô hình dự đoán.

Nhưng, tất nhiên, khách hàng của các nhà cái đang nhìn vào các cuộc thăm dò và lắng nghe những học giả đó. Họ nghe rằng Hilary đi trước 3%, một chứng chỉ chết để giành chiến thắng và quyết định một cách nhanh chóng để kiếm được 10 đô la là đặt cược 40 đô la vào cô ấy.

Một cách gián tiếp các học giả và các cuộc thăm dò đang di chuyển tỷ lệ cược.

. theo cách đó.)


2

Không có gì đáng ngạc nhiên khi những nỗ lực này đã thất bại, khi bạn xem xét sự chênh lệch giữa thông tin nào mà người mẫu có quyền truy cập và thông tin nào thúc đẩy hành vi tại phòng bỏ phiếu. Tôi đang suy đoán, nhưng các mô hình có thể tính đến:

  • một loạt các kết quả bỏ phiếu trước bầu cử
  • nghiêng nhà nước lịch sử (màu xanh / đỏ)
  • kết quả lịch sử của các cuộc bầu cử trước với các dự đoán / dự báo hiện tại

Nhưng, các cuộc thăm dò trước bầu cử là không đáng tin cậy (chúng ta đã thấy những thất bại liên tục trong quá khứ), các quốc gia có thể lật lại và không có đủ chu kỳ bầu cử trong lịch sử của chúng ta để giải thích cho vô số tình huống có thể, và làm, phát sinh .

Một sự phức tạp khác là sự hợp lưu của phiếu bầu phổ biến với trường đại học bầu cử. Như chúng ta đã thấy trong cuộc bầu cử này, phiếu bầu phổ biến có thể cực kỳ gần gũi trong một tiểu bang, nhưng một khi bang đó giành chiến thắng, tất cả các phiếu bầu sẽ thuộc về một ứng cử viên, đó là lý do tại sao bản đồ có quá nhiều màu đỏ.


1

Các mô hình bỏ phiếu đã không xem xét có bao nhiêu người Libertari có thể chuyển từ Johnson sang Trump khi nói đến việc bỏ phiếu thực tế. Các bang giành được lợi nhuận mỏng đã giành chiến thắng dựa trên tỷ lệ phiếu bầu mà Johnson nhận được. PA (đã đẩy Trump vượt qua 270 trong đêm bầu cử) chỉ trao 2% cho Johnson. NH (đã đi đến Clinton) đã trao 4% + cho Johnson. Johnson đã bỏ phiếu ở mức 4% -5% một ngày trước cuộc bầu cử và ông đã nhận được khoảng 3% vào ngày bầu cử.

Vậy tại sao Libertarians, tất cả đột ngột, chuyển sang ngày bầu cử? Không ai xem xét vấn đề trung tâm của cử tri Libertian là gì. Họ có xu hướng xem giải thích theo nghĩa đen của Hiến pháp là canon. Hầu hết những người bỏ phiếu cho bà Clinton đều không nghĩ rằng việc bãi bỏ luật pháp của bà là một ưu tiên đủ cao để xem xét. Chắc chắn, không cao hơn tất cả những gì họ không thích về Trump.

Bất kể những rắc rối pháp lý của cô ấy có quan trọng hay không đối với người khác, chúng sẽ quan trọng đối với Libertarians. Họ sẽ đặt ưu tiên rất cao cho việc tránh xa văn phòng một người xem tuân thủ pháp luật là tùy chọn, tốt nhất. Vì vậy, đối với một số lượng lớn trong số họ, giữ cho bà Obama không có chức vụ sẽ trở thành ưu tiên cao hơn so với việc tuyên bố rằng triết học Libertian là một triết lý chính trị khả thi.

Nhiều người trong số họ thậm chí có thể không thích Trump, nhưng nếu họ nghĩ rằng ông sẽ tôn trọng luật pháp hơn bà Clinton, thì chủ nghĩa thực dụng đã chiến thắng các nguyên tắc cho rất nhiều người trong số họ và khiến họ phải bỏ phiếu khi điều đó đã đến lúc bỏ phiếu thực sự.


NH có tất cả những người từ dự án nhà nước miễn phí sống ở đó. Đảng tự do phát triển mạnh và những người ủng hộ tích cực.
John

@ John, NH Libertarians mắc kẹt với Johnson (4%). Trump mất nhà nước 1%.
Dmitry Rubanovich

Tôi hiểu điều đó. Tôi đã cố gắng giải thích rằng đảng tự do rất mạnh về NH.
Giăng

@ John, nhưng nó không chỉ NH. Minnesota: Johnson 4%, Trump mất 2%; NV (một lập luận khó hơn để đưa ra, nhưng vẫn giữ xu hướng): Johnson 3,5%, Trump mất 2%; Maine: Johnson 5%, Trump mất 3%; Colorado Johnson 5%, Trump mất 3%.
Dmitry Rubanovich

Afaik, các cuộc thăm dò hỏi về khả năng chuyển đổi phiếu bầu và dự báo có thể xem xét. Bạn có bất kỳ thông tin nào cho thấy rằng trước cuộc bầu cử có bất kỳ thông tin nào như vậy không được xem xét bởi bất kỳ dự báo nào hay đây là một suy đoán thuần túy?
Tim

1

Thăm dò ý kiến ​​không phải là xu hướng lịch sử. Một người Bayes sẽ hỏi về xu hướng lịch sử. Kể từ thời Abraham Lincoln, đã có một đảng Cộng hòa và một đảng Dân chủ nắm giữ văn phòng tổng thống. Xu hướng thay đổi đảng 16 lần kể từ đó từ Wikipedia có chức năng khối lượng tích lũy sau đây

nhập mô tả hình ảnh ở đây

trong đó thời gian trong nhiều năm để thay đổi đảng tổng thống là trên -axis. Sau 8 năm của một đảng cầm quyền, tỷ lệ cược là 68,75% mà các cử tri bỏ phiếu cho một sự thay đổi, chỉ hơn 2 đến 1. Hơn nữa, kể từ cuộc bầu cử năm 1860, đảng Cộng hòa đã giữ vị trí tổng thống 59% so với 41% cho Dân chủ.x

Điều khiến các nhà báo, đảng Dân chủ và những người thăm dò ý kiến ​​cho rằng tỷ lệ cược ủng hộ chiến thắng của những người tự do có lẽ là suy nghĩ mơ ước. Hành vi có thể dự đoán được, trong giới hạn, nhưng trong trường hợp này, đảng Dân chủ đã ước rằng mọi người sẽ không bỏ phiếu cho một sự thay đổi, và từ góc độ lịch sử, dường như có nhiều khả năng sẽ không có.


0

Tôi nghĩ rằng kết quả thăm dò ý kiến ​​được ngoại suy đến mức công chúng cho rằng nhân khẩu học của cử tri sẽ tương tự như nhân khẩu học của người bỏ phiếu và sẽ là đại diện tốt cho toàn bộ dân số. Ví dụ: nếu 7 trong số 10 nhóm thiểu số ủng hộ Hillary trong các cuộc thăm dò và nếu nhóm thiểu số đó chiếm 30% dân số Hoa Kỳ, thì phần lớn các cuộc thăm dò giả định 30% cử tri sẽ được đại diện bởi thiểu số đó và được chuyển sang mức tăng 21% đó cho Đồi. Trong thực tế, nam giới da trắng, trung lưu đến thượng lưu được đại diện tốt hơn trong số các cử tri. Ít hơn 50% số người đủ điều kiện đã bỏ phiếu và điều này đã không chuyển thành 50% cho tất cả giới tính, chủng tộc, v.v.

Hoặc, các cuộc thăm dò giả định ngẫu nhiên hoàn hảo và dựa trên các mô hình của họ dựa trên điều đó nhưng trong thực tế, dữ liệu cử tri lại thiên về những người đàn ông thuộc tầng lớp trung lưu đến thượng lưu.

Hoặc, các cuộc thăm dò không chính xác giả định ngẫu nhiên hoàn hảo nhưng các tham số ngoại suy của họ đánh giá thấp sự không đồng nhất của nhân khẩu học cử tri.

ETA: Các cuộc thăm dò của hai cuộc bầu cử trước đó đã hoạt động tốt hơn do sự chú ý tăng lên đối với việc bỏ phiếu của các nhóm thường không được đại diện tốt.


Theo như tôi biết, tất cả các cuộc thăm dò đều dựa trên dự đoán của họ về 'các cử tri có khả năng'. Tôi không thể tưởng tượng các cuộc thăm dò cho rằng một người 20 tuổi có cơ hội bỏ phiếu giống như một người 70 tuổi. Trung tâm hơn có vẻ là vấn đề: làm thế nào có khả năng ai đó bỏ phiếu?
dimpol

Kế toán cho nhân khẩu học là phần dễ nhất. Bạn chỉ cần xem lại dân số mẫu của bạn với dân số thực tế. Tuy nhiên, việc tính toán cho cử tri bỏ phiếu và những thành kiến ​​được đề cập trong các câu trả lời khác khó hơn rất nhiều.
Graodes

Có rất nhiều sự đa dạng trong cách những người thăm dò giải quyết những vấn đề này. Một số tái cân bằng nhân khẩu học hoặc tái cân bằng dựa trên liên kết đảng, số khác thì không. Nhưng, do có sự khác biệt về các mô hình sử dụng trung bình bỏ phiếu, kết quả cuối cùng sẽ rất mạnh đối với các vấn đề cụ thể đối với một phương pháp thực hiện điều này không được chia sẻ bởi các cuộc thăm dò khác, đặc biệt là sau khi kiểm soát các sai lệch đảng phái lịch sử (cụ thể là hiệu ứng nhà) hoạt động bỏ phiếu. Các vấn đề trong kết quả bỏ phiếu trung bình phải đến từ các phương pháp hoặc hiệu ứng được chia sẻ, chứ không phải các phương pháp cụ thể cho từng cuộc thăm dò.
ohwilleke

0

HoraceT và CliffAB (xin lỗi quá lâu để nhận xét) Tôi sợ tôi có cả đời làm gương, điều này cũng dạy tôi rằng tôi cần phải rất cẩn thận với lời giải thích của họ, nếu tôi muốn tránh làm mất lòng mọi người. Vì vậy, trong khi tôi không muốn sự nuông chiều của bạn, tôi yêu cầu sự kiên nhẫn của bạn. Đây là:

Để bắt đầu với một ví dụ cực đoan, tôi đã từng thấy một câu hỏi khảo sát được đề xuất là hỏi những người nông dân làng mù chữ (Đông Nam Á), để ước tính 'tỷ lệ lợi nhuận kinh tế' của họ. Bỏ các tùy chọn trả lời sang một bên bây giờ, chúng ta có thể hy vọng tất cả đều thấy rằng đây là một việc ngu ngốc để làm, nhưng giải thích một cách nhất quán tại sao nó ngu ngốc không phải là quá dễ dàng. Vâng, chúng tôi chỉ đơn giản có thể nói rằng đó là ngu ngốc vì người trả lời sẽ không hiểu câu hỏi và chỉ loại bỏ nó như là một vấn đề ngữ nghĩa. Nhưng điều này thực sự không đủ tốt trong bối cảnh nghiên cứu. Thực tế là câu hỏi này đã từng được đề xuất ngụ ý rằng các nhà nghiên cứu có sự biến đổi vốn có về những gì họ cho là 'ngu ngốc'. Để giải quyết vấn đề này một cách khách quan hơn, chúng ta phải lùi lại và tuyên bố minh bạch một khuôn khổ liên quan để ra quyết định về những điều đó. Có nhiều lựa chọn như vậy,

Vì vậy, hãy minh bạch rằng chúng ta có hai loại thông tin cơ bản mà chúng ta có thể sử dụng trong các phân tích: định tính và định lượng. Và rằng cả hai có liên quan bởi một quá trình biến đổi, sao cho tất cả các thông tin định lượng bắt đầu như thông tin định tính nhưng trải qua các bước sau (quá mức):

  1. Cài đặt hội nghị (ví dụ: tất cả chúng ta đã quyết định rằng [bất kể chúng ta cảm nhận nó như thế nào], tất cả chúng ta sẽ gọi màu của bầu trời mở ban ngày màu xanh da trời.)
  2. Phân loại (ví dụ: chúng tôi đánh giá mọi thứ trong phòng theo quy ước này và tách tất cả các mục thành các loại 'màu xanh' hoặc 'không phải màu xanh')
  3. Đếm (chúng tôi đếm / phát hiện 'số lượng' vật màu xanh trong phòng)

Lưu ý rằng (theo mô hình này) không có bước 1, sẽ không có chất lượng như vậy và nếu bạn không bắt đầu với bước 1, bạn không bao giờ có thể tạo ra số lượng có ý nghĩa.

Sau khi được nêu, tất cả điều này có vẻ rất rõ ràng, nhưng đó là những nguyên tắc đầu tiên mà (tôi thấy) thường bị bỏ qua nhất và do đó dẫn đến 'Rác-vào'.

Vì vậy, "sự ngu ngốc" trong ví dụ trên trở nên rất rõ ràng khi không thể thiết lập một quy ước chung giữa người nghiên cứu và người trả lời. Tất nhiên đây là một ví dụ cực đoan, nhưng những sai lầm tinh vi hơn nhiều có thể tạo ra rác không kém. Một ví dụ khác mà tôi đã thấy là một cuộc khảo sát về nông dân ở vùng nông thôn Somalia, đã hỏi về cách thức biến đổi khí hậu ảnh hưởng đến sinh kế của bạn như thế nào? Hoa Kỳ sẽ tạo thành một thất bại nghiêm trọng trong việc sử dụng một quy ước chung giữa nhà nghiên cứu và người trả lời (nghĩa là đối với những gì được đo lường là "biến đổi khí hậu").

Bây giờ hãy chuyển sang các tùy chọn đáp ứng. Bằng cách cho phép người trả lời tự trả lời mã từ một tập hợp nhiều lựa chọn hoặc cấu trúc tương tự, bạn cũng đang đẩy vấn đề 'quy ước' này vào khía cạnh của câu hỏi này. Điều này có thể ổn nếu tất cả chúng ta đều tuân thủ các quy ước 'phổ quát' một cách hiệu quả trong các loại phản ứng (ví dụ: câu hỏi: bạn sống ở thị trấn nào? Danh mục trả lời: danh sách tất cả các thị trấn trong khu vực nghiên cứu [cộng với 'không thuộc khu vực này']). Tuy nhiên, nhiều nhà nghiên cứu dường như thực sự tự hào về sắc thái tinh tế của các câu hỏi và loại câu trả lời của họ để đáp ứng nhu cầu của họ. Trong cùng một khảo sát cho thấy câu hỏi 'tỷ lệ lợi nhuận kinh tế' xuất hiện, nhà nghiên cứu cũng yêu cầu những người được hỏi (dân làng nghèo), cung cấp lĩnh vực kinh tế nào mà họ đóng góp: với các loại phản ứng về 'sản xuất', 'dịch vụ', "Sản xuất" và "tiếp thị". Một lần nữa một vấn đề quy ước định tính rõ ràng phát sinh ở đây. Tuy nhiên, vì anh ta đưa ra các câu trả lời loại trừ lẫn nhau, nên những người được hỏi chỉ có thể chọn một lựa chọn (bởi vì nó dễ dàng hơn để nuôi SPSS theo cách đó), và nông dân làng thường xuyên sản xuất cây trồng, bán sức lao động, sản xuất thủ công và làm mọi thứ Bản thân thị trường địa phương, nhà nghiên cứu đặc biệt này không chỉ có vấn đề về hội nghị với những người được hỏi, anh ta có một vấn đề với thực tế.

Đây là lý do tại sao các lỗ hổng cũ như tôi sẽ luôn đề xuất cách tiếp cận chuyên sâu hơn về việc áp dụng mã hóa vào thu thập dữ liệu - vì ít nhất bạn có thể đào tạo đầy đủ các lập trình viên trong các quy ước do nhà nghiên cứu tổ chức (và lưu ý rằng cố gắng truyền đạt các quy ước như vậy cho người trả lời ' bây giờ hướng dẫn khảo sát 'là một trò chơi của Mug cốc điều chỉnh tôi tin tưởng vào trò chơi này). Cũng lưu ý rằng nếu bạn chấp nhận 'mô hình thông tin' ở trên (một lần nữa, tôi không khẳng định bạn phải như vậy), điều đó cũng cho thấy tại sao thang đo phản ứng bán chuẩn có tiếng xấu. Đây không chỉ là các vấn đề toán học cơ bản theo quy ước của Steven (tức là bạn cần xác định nguồn gốc có ý nghĩa ngay cả đối với các giáo phẩm, bạn không thể thêm và tính trung bình chúng, v.v.), v.v.), đó cũng là điều mà họ thường chưa bao giờ trải qua bất kỳ quá trình biến đổi nhất quán được khai báo và logic nhất quán nào có thể lên tới 'lượng hóa' (tức là một phiên bản mở rộng của mô hình được sử dụng ở trên cũng bao gồm việc tạo ra 'đại lượng thứ tự' [-đây không khó làm]). Dù sao, nếu nó không thỏa mãn các yêu cầu về thông tin định tính hoặc định lượng, thì nhà nghiên cứu thực sự tuyên bố đã phát hiện ra một loại thông tin mới bên ngoài khuôn khổ, và do đó, họ phải giải thích đầy đủ cơ sở khái niệm cơ bản của nó ( tức là minh bạch xác định một khuôn khổ mới).

Cuối cùng, hãy xem xét các vấn đề lấy mẫu (và tôi nghĩ rằng điều này phù hợp với một số câu trả lời khác đã có ở đây). Ví dụ, nếu một nhà nghiên cứu muốn áp dụng một quy ước về những gì tạo thành một cử tri 'tự do', họ cần chắc chắn rằng thông tin nhân khẩu học họ sử dụng để chọn chế độ lấy mẫu của họ phù hợp với quy ước này. Cấp độ này thường dễ xác định và xử lý nhất vì nó phần lớn nằm trong sự kiểm soát của nhà nghiên cứu và thường là loại quy ước định tính giả định được tuyên bố minh bạch trong nghiên cứu. Đây cũng là lý do tại sao nó là cấp độ thường được thảo luận hoặc phê bình, trong khi các vấn đề cơ bản hơn không được giải quyết.

Vì vậy, trong khi những người bỏ phiếu dính vào những câu hỏi như 'bạn dự định bỏ phiếu cho ai vào thời điểm này?', Thì có lẽ chúng tôi vẫn ổn, nhưng nhiều người trong số họ muốn nhận được nhiều 'fancier' hơn so với điều này

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.