Brexit: có phải là rời khỏi ý nghĩa thống kê? [đóng cửa]


12

Trong bài đăng này, chúng tôi đặt câu hỏi về một hiện tượng tự nhiên được gọi là con người cố gắng tìm kiếm quyết định bằng cách kiểm phiếu . Sự cố cụ thể của hiện tượng tự nhiên như vậy mà câu hỏi này là về trường hợp của Brexit .

Lưu ý: câu hỏi không phải là về chính trị. Mục tiêu là cố gắng thảo luận về hiện tượng tự nhiên như vậy theo quan điểm thống kê dựa trên các quan sát.

Câu hỏi cụ thể là:

  • Câu hỏi:51.9% Brexit bỏ phiếu để rời khỏi nghĩa là gì? Ví dụ, điều đó có nghĩa là công chúng thực sự muốn rời khỏi EU? Nó chỉ đơn giản có nghĩa là công chúng không chắc chắn và cần thêm thời gian để suy nghĩ? Hay nó là cái gì khác?

Giả định 1: không có lỗi trong quá trình bỏ phiếu.


14
Dân chủ không phải là về ý nghĩa thống kê. Kết quả 51,9% có nghĩa là 51,9% những người đã bỏ phiếu, bỏ phiếu "rời đi". Đây không phải là một cuộc thăm dò ý kiến. Những người không bỏ phiếu, đã bỏ phiếu bằng cách (không) sử dụng đôi chân của họ. Giải thích 51,9% là "công khai là không chắc chắn và cần thêm thời gian để suy nghĩ" chỉ đơn giản là nói dối với số liệu thống kê. Brexit đã xảy ra với xác suất 1.
Tim

7
Chủ đề này được định sẵn là không thống kê, ý kiến, và thậm chí có thể chính trị. Nó chỉ không phù hợp với trang web này, bất kể mức độ phổ biến của nó. Chúng tôi có một phòng trò chuyện với những người sẽ vui vẻ tham gia vào các cuộc trò chuyện như vậy: hãy xem thử!
whuber

2
Tôi tin rằng các cuộc thảo luận hiện tại được tập trung thống kê và là một ví dụ tốt về diễn giải kết quả bỏ phiếu vì nó áp dụng cho kiểm tra thống kê.
Underminer

3
Bạn đưa ra một vấn đề quan trọng: lỗi đo lường của các số liệu dư luận, chẳng hạn như các cuộc thăm dò. Tôi sợ rằng nguồn lỗi chính không phải từ kích thước mẫu.
Aksakal

4
IMHO, đây là một câu hỏi không thống kê với một veneer số liệu thống kê mỏng được thêm vào để ngụy trang thực tế đó. Khi tôi đọc nó, giả định "không có lỗi trong quá trình bỏ phiếu" loại bỏ tất cả các cân nhắc thống kê và nhất thiết phải chuyển cuộc thảo luận về "bỏ phiếu ... có nghĩa là gì" trong một nền dân chủ. Đó là vấn đề của khoa học chính trị và triết học, không phải thống kê.
whuber

Câu trả lời:


17

Tôi đồng ý với @Underminer rằng không có lỗi lấy mẫu, nhưng không phải vì mẫu lớn mà vì không có mẫu liên quan . Không ai được lấy mẫu để bỏ phiếu. Rõ ràng có một số phần không đáng kể của những người muốn bỏ phiếu nhưng, không thể (ví dụ như bị tai nạn xe hơi vào ngày này), hoặc những người đã bỏ phiếu không hợp lệ, nhưng đó là "mẫu" duy nhất ở đây.

Kết quả là chính xác, không có lỗi liên quan vì toàn bộ dân số đã tham gia bỏ phiếu (một số tham gia bằng cách không tham gia vào nó). Một số người quyết định bỏ phiếu, một số thì không. Một số quyết định bỏ phiếu nghỉ phép, một số thì không. Dân chủ không phải là về ý nghĩa thống kê, mà là về những gì thực sự đã xảy ra . Bỏ phiếu không nhằm tìm hiểu ý kiến ​​của mọi người, mà là để đưa ra quyết định. Trên thực tế, mọi người đôi khi không bỏ phiếu theo những gì họ nghĩ, nhưng để biểu hiện, hoặc đạt được một cái gì đó . Ví dụ, trong cuộc bầu cử, mọi người có thể bỏ phiếu không phải cho ứng cử viên ưa thích của họ, nhưng cho người được ưu tiên thứ hai nếu họ nghĩ rằng anh ta có cơ hội chiến thắng cao hơn.


Hãy xem xét trường hợp của một khu vực màu xám nơi dân số bỏ phiếu không chắc chắn về những gì tốt cho họ. Ví dụ, trường hợp có 2 ứng viên gần như tốt như nhau. Trong trường hợp như vậy, tôi nghĩ rằng những người bỏ phiếu, có thể sẽ khác biệt một cách không hệ thống vì tôi nghĩ rằng phiếu bầu của họ có thể có sự phân phối gần với thống nhất. Mục tiêu của tôi ở đây không phải là xác định lại dân chủ (một chủ đề chính trị) mà là để xem chúng ta có thể nói gì về việc Brexit có phải là một khu vực màu xám không?
thượng cổ

2
@caveman cho dù họ có chắc chắn hay không, điều quan trọng là cách họ bỏ phiếu vì bỏ phiếu là về phiếu bầu thực tế. Chắc chắn, một số người không có ý kiến ​​rõ ràng, với một số người trong số họ bỏ phiếu và một số thì không, nhưng điều này cũng không quan trọng vì số phiếu là số phiếu thực tế của những người đã bỏ phiếu.
Tim

Nếu tôi hiểu chính xác, quan điểm của bạn là về cách dân chủ diễn giải phiếu bầu? Tôi đồng ý với bạn. Tuy nhiên, tôi không diễn giải nó theo cách của các chính trị gia. Tôi đang cố gắng sử dụng dân số để xác định xem một quyết định là tốt, xấu hay không rõ ràng. Đây là một cách sử dụng khác nhau của bỏ phiếu.
thượng cổ

2
@caveman mọi người thay đổi suy nghĩ mọi lúc, các nhà tâm lý học đã viết hàng ngàn bài báo về điều này ... Vâng, 51,9% không có nghĩa là chính xác 51,9% người Anh chắc chắn 100% rời khỏi EU. Mọi người thậm chí có thể không chắc chắn về việc so sánh độ dài của các dòng ( en.wikipedia.org/wiki/Asch_conformity_experiment ) ...
Tim

1
@Aksakal Tôi sẽ không bình luận về ai đủ điều kiện để bỏ phiếu và ai không. Tôi cũng sẽ không bình luận về việc khó có thể có được các thông tin cần thiết. Đó là chính trị và như vậy không phải là chủ đề ở đây. Từ góc độ thống kê, mỗi cử tri đủ điều kiện có xác suất không bỏ phiếu nhất định. Xác suất này có thể bị ảnh hưởng bởi các yếu tố nhất định có thể có hoặc không liên quan đến sở thích của họ, nhưng mỗi cử tri đủ điều kiện chọn (không) thực hiện quyền đó theo quyết định của mình.
dùng3697176

9

51,9% là tỷ lệ cử tri muốn ra đi . Vì kích thước mẫu quá lớn (> 33 triệu), nên hầu như không có lỗi lấy mẫu ngẫu nhiên.

Kiểm tra ý nghĩa thống kê sẽ cố gắng xác định xem sự khác biệt trong phần còn lạinghỉ có thể được giải thích chỉ bằng lỗi lấy mẫu ngẫu nhiên hay không, và sự khác biệt chắc chắn sẽ rất đáng kể (xem câu trả lời của @ caveman).

Vấn đề với cách tiếp cận này là ý nghĩa thống kê đưa ra một giả định rất mạnh mẽ rằng mẫu này là đại diện cho toàn bộ dân số (tất cả của Anh), không chỉ những người bỏ phiếu.

Tỷ lệ không phản hồi (những người không bỏ phiếu) là vô cùng quan trọng trong việc xác định xem hơn một nửa số nước Anh muốn 'rời đi', và rất khó để đo lường. Xu hướng không phản hồi được tạo ra khi các nhóm con ít có khả năng bỏ phiếu có quan điểm khác nhau một cách có hệ thống. Ví dụ, dựa trên các cuộc thăm dò ý kiến, các thiên niên kỷ ít có khả năng bỏ phiếu, nhưng nhiều khả năng bỏ phiếu vẫn còn , điều này làm sai lệch kết quả khi cố gắng đại diện cho dân số của cả nước Anh.

Vì lý do này, kiểm tra ý nghĩa thống kê theo nghĩa truyền thống của nó phần lớn là không phù hợp .


Giả định: Chúng ta cần xác định một số thuật ngữ cho bất kỳ điều nào trong số này để có ý nghĩa và tránh thảo luận chính trị về những gì bỏ phiếu đang cố gắng thực hiện. Dưới đây là định nghĩa của tôi:

Dân số: Mọi người sống ở Anh

Khung lấy mẫu: Mọi người đủ điều kiện bỏ phiếu có khả năng bỏ phiếu

Phương pháp lấy mẫu: Phản ứng tự nguyện, hành động bỏ phiếu đang tham gia khảo sát

Mẫu: Các cá nhân thực sự bỏ phiếu

Trong thiết lập này, tỷ lệ mẫu có thể được sử dụng (tốt hơn hoặc xấu hơn) để ước tính tỷ lệ phần trăm của tất cả những người nghiêng về phía còn lại (hoặc rời đi ).


8

Bạn hỏi

Việc bỏ phiếu 51,9% Brexit có ý nghĩa gì?

Nó có nghĩa là 51,9% cử tri bỏ phiếu để lại.

Ví dụ, điều đó có nghĩa là công chúng thực sự muốn rời khỏi EU? Nó chỉ đơn giản có nghĩa là công chúng không chắc chắn và cần thêm thời gian để suy nghĩ? Hay nó là cái gì khác?

Số phiếu bao gồm phiếu "để lại" và 1617421887 phiếu "còn lại", chỉ ra 1216146297 cử tri đủ điều kiện đã không bỏ phiếu và khoảng 18 triệu dân không phải là cử tri đủ điều kiện. Vì cả bộ sưu tập cử tri thực tế cũng không phải bộ sưu tập cử tri đủ điều kiện là "công chúng" và cũng không phải là đại diện (ngẫu nhiên, không thiên vị, chọn một tính từ có liên quan) của mẫu "công khai", phiếu bầu Brexit 51,9% không phù hợp với thứ hai của bạn và những câu hỏi tiếp theo.1293135318

Có thể xây dựng một bảng câu hỏi đáp ứng câu hỏi của bạn. Điều này dường như không phải là những gì đã xảy ra trong cuộc trưng cầu dân ý như đã thực hiện.


1
Bạn có thể vui lòng thảo luận về ý nghĩa của các phiếu bầu liên quan đến cử tri (không phải toàn bộ dân số), ngoài kết luận bề ngoài rằng nó có nghĩa là " 51,9% bỏ phiếu "? Tôi tự hỏi mức độ thông tin chúng ta có thể trích xuất từ ​​đây là gì.
thượng cổ

4
Caveman, nhận xét này, hơn bất kỳ ai khác, chứng tỏ câu hỏi của bạn là không thống kê. Bởi vì 51,9% (cùng với tổng số) tạo thành tất cả dữ liệu bằng chứng về cử tri và không có sự không chắc chắn (trừ khi bạn muốn thách thức tính chính xác của việc đếm, đó là một vấn đề riêng biệt), việc bạn từ chối câu trả lời này ngụ ý bạn đang tìm kiếm kết luận phi thống kê .
whuber

Điều gì sẽ xảy ra nếu chúng ta mô hình hóa Brexit như một vấn đề phân loại nhị phân và coi cử tri là ước tính của các phân loại là thành viên của một nhóm. Trong mô hình này, mục tiêu không phải là xác định phần lớn công dân muốn gì, mà là mục tiêu là xác định phân loại tối ưu từ không gian của phân loại. Sau đó, chúng ta có thể sử dụng một số biện pháp để kiểm tra mức độ tốt của nhóm phân loại dựa trên cử tri. Ví dụ: chúng tôi có thể sử dụng Perplexity hoặc một cái gì khác phù hợp cho nhiệm vụ phân loại nhị phân này khi không xác định được sự thật mặt đất (ví dụ: chúng tôi rõ ràng không biết nếu nghỉ phép tốt hơn vẫn còn).
thượng cổ

@caveman: Cho rằng không xác định được sự thật cơ bản (chính xác), bạn sẽ sử dụng số liệu nào để "xác định trình phân loại tối ưu từ không gian của phân loại"? Bất kỳ số liệu nào như vậy đều mã hóa thành kiến ​​của nhà phân tích chọn số liệu, ngoại trừ số liệu "tái tạo kết quả của phiếu bầu", cho số liệu nào bạn đã biết câu trả lời: 51,9% / 48,1%.
Tháp Eric

@EricTowers Tôi đã đưa điều này đến chính trị.stackexchange.com nơi tôi đã nói về các phương pháp khác nhau - chính
caveman

2

TL; DR

Tôi đã mô phỏng một quần thể không chắc chắn bên dưới (dưới chi tiết ) với lần, và sau đó đo xác suất quan sát phiếu bầu nghỉ phép 51,9 % trong dân số mô phỏng không chắc chắn đó . Điều này đã cho tôi những khả năng mô phỏng rằng một dân số không chắc chắn có thể đạt được một nghỉ phiếu đó làR=100051.9% hoặc cao hơn.51.9%

Đây mô phỏng khả năng nghỉ dưới sự chắc chắn dân số là .0

Có lẽ không cần thiết, nhưng tôi cũng đã làm tương tự nhưng với vẫn để đo xác suất mà như vậy chắc chắn dân số để có được một phiếu bầu giữ .48.1%

Xác suất mô phỏng này vẫn còn trong dân số không chắc chắn cũng là .0

Do đó, tôi kết luận rằng bỏ phiếu Brexit không phải là tác dụng phụ ồn ào của dân số không chắc chắn hoặc nhầm lẫn . Dường như có một lý do có hệ thống khiến họ rời khỏi EU.

Tôi đã tải lên mã giả lập tại đây: https://github.com/Al-Caveman/Brexit

Chi tiết

Giả định 1 , các câu trả lời có thể có (hoặc giả thuyết) là:

  • :H0Công chúng là không chắc chắn .
  • :H1Công chúngtự tinmuốn rời đi .

Lưu ý: không thể nào công chúng tự tin muốn ở lại vì chúng tôi đã loại trừ các lỗi bỏ phiếu.

Để trả lời câu hỏi này (tức là liệu H0 hay H1 ), tôi cố gắng đo:

  • Xác suất dân số không chắc chắn có thể đạt được 51.9% nghỉ phiếu.
  • Hoặc, xác suất rằng một dân số không chắc chắn có thể đạt được 151.9% vẫn bỏ phiếu.

Nếu xác suất này đủ thấp, chúng ta có thể kết luận rằng công chúng tự tin muốn rời đi (tức là ). Tuy nhiên, nếu xác suất này đủ lớn, chúng ta có thể kết luận rằng công chúng không chắc chắn về việc quyết định Brexit (tức là H 0H1H0 ).

Để đo lường xác suất này, chúng ta cần biết sự phân bố của một dân số Anh không chắc chắn trong một hệ thống bỏ phiếu nhị phân như Brexit. Vì vậy, bước đầu tiên của tôi là mô phỏng phân phối này bằng cách làm theo giả định dưới đây:

  • Giả định 2: một dân số bao gồm các cá nhân không chắc chắn sẽ có một cơ hội bỏ phiếu ngẫu nhiên . Tức là mọi câu trả lời có thể có cơ hội được lựa chọn như nhau.

Theo quan điểm của tôi giả định này là công bằng / hợp lý.

Ngoài ra, chúng tôi mô hình các chiến dịch nghỉ phépduy trì là hai quy trình riêng biệt như sau:

  • Quá trình với sản lượng O nghỉ = [ l 1 , l 2 , ... , l n ] .PleaveOleave=[l1,l2,,ln]
  • Quá trình với sản lượng O vẫn = [ r 1 , r 2 , ... , r n ] .PremainOremain=[r1,r2,,rn]

Ở đâu:

  • là tổng dân số của Vương quốc Anh (bao gồm cả những người không bỏ phiếu).n
  • Với mọi , l i , r i{ 0 , 1 } . Giá trị đầu ra bằng 0 biểu thị rằng một cử tri đã bỏ phiếu không cho quy trình chủ đề và 1 ý nghĩa mà một cử tri đã bỏ phiếu đồng ý cho cùng một quy trình.i{1,2,,n}li,ri{0,1}01

tuân theo các ràng buộc sau:

  • Với bất kỳ , l ir i không thể đồng thời là 1 cùng một lúc. Tức là l i = 1 nhất thiết ngụ ý rằng r i = 0r i = 1 nhất thiết ngụ ý rằng l i = 0 . Điều này là do thực tế là một cử tri i trong dân số { 1 , 2 ,, .i{1,2,,n}liri1li=1ri=0ri=1li=0i không thể bỏ phiếu cho cả hairời đivẫnở cùng một lúc.{1,2,,n}

Ví dụ, nếu , nó có nghĩa là ra khỏi một dân số 3 , ai đã bình chọn để lại và hai đã bỏ phiếu không phải rời khỏi .Oleave=[1,0,0]3

Tương tự như vậy, nếu , nó có nghĩa là ra khỏi một dân số 3 , ai đã bình chọn để duy trì và hai đã bỏ phiếu không có để duy trì .Oremain=[0,1,0]3

Lưu ý rằng trong cả hai ví dụ trên, có một thành viên của dân số chưa bỏ phiếu cho bất kỳ quy trình (hoặc chiến dịch) nào. Cụ thể, cử tri thứ ba (tức là ).Oleave[3]=Oremain[3]=0

Những gì chúng ta biết từ đây là trong số lá phiếu, 51,9 % đã bỏ phiếu rời khỏi EU (tức là 100 - 51,9 = 48,1 % được bỏ phiếu vẫn còn ). Điều này có nghĩa là:33,568,18451.9%10051.9=48.1%

  • .n=33,568,184
  • đã bỏ phiếuđồng ývớichiến dịchnghỉ phép. Tức là 33 , 568 , 184 Σ i = 1 O nghỉ [ i ] = 17 , 421 , 887,496 17 , 421 , 88733,568,184×0.519=17,421,887.496
    i=133,568,184Oleave[i]=17,421,887.49617,421,887
  • đã bỏ phiếuđồng ývớichiến dịchcòn lại. Tức là 33 , 568 , 184 Σ i = 1 O vẫn [ i ] = 16 , 146 , 296,504 16 , 146 , 29733,568,184×(10.519)=16,146,296.504
    i=133,568,184Oremain[i]=16,146,296.50416,146,297

Do đó, chúng tôi xác định các mảng đầu ra như sau:

  • i{1,2,,17421887}Oleave[i]=1
  • i{17421887+1,17421887+2,,33568184}Oleave[i]=0
  • i{1,2,,17421887}Oremain[i]=0.
  • For all i{17421887+1,17421887+2,,33568184}, Oremain[i]=1.
  • By Assumption 2, for all i{1,2,,33568184}, Ounsure,m[i]=C, where C is a uniformly distributed random variable that takes values in {0,1} (e.g. a fair coin toss), and m is a number that identifies a particular random instantiation of Ounsure,m. In other words, the probability that two distinct random instantiations of Ounsure,m equal each other, i.e. Ounsure,1=Ounsure,2, is 0.533,568,184.

Finally, we define the pleave value of the leave process as follows:

pleave=1Rm=1R{1if (i=133,568,184Oleave[i])(i=133,568,184Ounsure,m[i])0else
where R is total number of simulation rounds by which at each time a random instance of Ounsure,m is defined.

Likewise, we define the premain value of the remain process as follows:

premain=1Rm=1R{1if (i=133,568,184Oremain[i])(i=133,568,184Ounsure,m[i])0else

To answer that, I simulated the above in C using R=1,000 and the output is:

total leave votes: 17421887
total remain votes: 16146297
simulating p values............ ok
p value for leave: 0.000000
p value for remain: 0.000000

In other words:

  • pleave=0.
  • premain=0.

2
Perhaps more important in this case is the non-response rate (i.e. individuals who do no vote). The margin of error (or measure of statistical significance) only takes into account random sample error. Non-response bias is NOT included in this, and it is much more impactful than random sampling error with a poll with such a large sample size.
Underminer

Here it says that UK has 46,499,537 eligible voters. Meaning 46,499,537(17421887+16146297)=12,931,353 didn't vote. Any idea how to interpret such unvoting population? Source: en.wikipedia.org/wiki/…
caveman

3
There is no statistically satisfactory way to deal with non-random missing data.
Underminer

Those who haven't voted, could be composed of individuals that don't care about politics (e.g. no more trust). Alternatively, it such unvoters could be those who were not sure. Or, it could be a mixture of the two. What would happen if we assume that "all unvoters are unsure"? Would this be an upper bound for testing whether the current situation was one where the public was feeling that Brexit was a grey area?
caveman

3
There is a confusion here about the nature & scope of statistics. You are attempting to create a process model of voting, & how that can inform the mechanisms & validity of governance & public decision making. This is a worthwhile task in Political Science. It is simply not statistics (although statistics is involved).
gung - Reinstate Monica

1

You could ask a slightly different question: Assuming that 50% of a very large population voted "Yes", and you asked a random sample of size S, what is the probability that 51.9% of your sample responded "Yes", depending on the sample size?

The expected value of number of "Yes" votes is 0.5 S. The variance is 0.25 S. The standard definition is 0.5 S1/2. A deviation of the actual from the expected number of "Yes" votes more than 6.1 standard deviations has a chance of one in a billion.

We have this when 0.019 S (difference between 50% and 51.9%) is 6.1 * 0.5 * S1/2, or S = (6.10.5/0.019)2 or S ≈ 25,800.


0

This is another solution using an analytical method instead of a simulation.

Previously, I have simulated an unsure population to be one that its vote is random chance guessing. So out of n many voters, an unsure population would tend to vote leave or remain for 0.5 of the time.

In order for an unsure population to get exactly 51.9% vote on leave, there needs to be 17,421,887 1s in Oleave. The probability for this is 0.533,568,184. Similarly, the probability of getting 17,421,887+1 votes is also 0.533,568,184. This goes on.

This is the probability of getting 17,421,887 votes:

i=17,421,88733,568,1840.533,568,184=(33,568,18417,421,887)×0.533,568,184=8.39663381928984×10101050240

(8.39663381928984×1010105024 calculated by Wolframalpha)

And this is the probability of having 51.9% of an unsure population vote leave.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.