Hồi quy trung bình so với ngụy biện của người đánh bạc


29

Một mặt, tôi có hồi quy trung bình và mặt khác tôi có ngụy biện con bạc .

Sự nguỵ biện của người đánh bạc được Miller và Sanjurjo (2019) định nghĩa là một người lầm tưởng rằng các chuỗi ngẫu nhiên có xu hướng hệ thống đối với sự đảo ngược, nghĩa là các chuỗi kết quả tương tự có nhiều khả năng kết thúc hơn là tiếp tục. nhiều lần liên tiếp sẽ được cho là không tương xứng có khả năng rơi đuôi trong phiên tòa tiếp theo.

Tôi đã có một màn trình diễn tốt trong trò chơi cuối cùng và theo hồi quy trung bình, có lẽ tôi sẽ có một màn trình diễn tệ hơn trong trò chơi tiếp theo.

Nhưng theo lời ngụy biện của người đánh bạc: Hãy xem xét hai xác suất sau đây, giả sử một đồng tiền công bằng

  1. xác suất 20 đầu, sau đó 1 đuôi =0.520×0.5=0.521
  2. xác suất 20 đầu, sau đó 1 đầu =0.520×0.5=0.521

Sau đó...

Xem xét một ví dụ đơn giản: Một lớp học sinh làm bài kiểm tra đúng / sai 100 mục về một chủ đề. Giả sử rằng tất cả các sinh viên chọn ngẫu nhiên trên tất cả các câu hỏi. Sau đó, điểm số của mỗi học sinh sẽ là sự hiện thực hóa một trong các tập hợp các biến ngẫu nhiên độc lập và phân phối giống hệt nhau, với giá trị trung bình dự kiến ​​là 50.

Đương nhiên, một số sinh viên sẽ đạt điểm đáng kể trên 50 và một số đáng kể dưới 50 chỉ là tình cờ. Nếu một người chỉ mất 10% số học sinh đạt điểm cao nhất và cho họ bài kiểm tra thứ hai mà họ lại chọn ngẫu nhiên trên tất cả các mục, thì điểm trung bình sẽ lại được dự đoán là gần 50.

Do đó, giá trị trung bình của những học sinh này sẽ hồi quy lại về tất cả các sinh viên đã làm bài kiểm tra gốc. Bất kể học sinh đạt điểm nào trong bài kiểm tra gốc, dự đoán tốt nhất về điểm số của họ trong bài kiểm tra thứ hai là 50.

Đặc biệt Nếu một người chỉ đạt điểm 10% cao nhất của sinh viên và cho họ làm bài kiểm tra thứ hai mà họ lại chọn ngẫu nhiên trên tất cả các mục, điểm trung bình sẽ lại được dự đoán là gần 50.

Theo ngụy biện của người đánh bạc, không nên dự đoán xác suất tương tự cho điểm và không nhất thiết phải gần 50?

Miller, JB, & Sanjurjo, A. (2019). Kinh nghiệm xác nhận sự sai lầm của người đánh bạc như thế nào khi kích thước mẫu bị bỏ qua.


5
Tôi không thấy cách thức Fallacy của Gambler được kết nối với hai xác suất bạn tính toán. Bạn có thể giải thích chính xác hơn những gì bạn hiểu sai lầm này là gì?
whuber

Là trò chơi của bạn để có chuỗi đầu chạy dài nhất?
AdamO

1
Tôi thực sự thích một lời giải thích cho điều này. Các câu trả lời cho đến nay dường như chưa làm sáng tỏ nó cho tôi. Hồi quy trung bình xuất hiện để làm cho các sự kiện độc lập phụ thuộc. Có lẽ hồi quy cho giá trị trung bình không bao giờ có thể được sử dụng cho chỉ một quan sát, nó chỉ áp dụng khi có một giá trị trung bình.
icc97

Câu trả lời:


28

Tôi nghĩ rằng sự nhầm lẫn có thể được giải quyết bằng cách xem xét rằng khái niệm "hồi quy theo nghĩa" thực sự không liên quan gì đến quá khứ. Đó chỉ là quan sát tautological rằng ở mỗi lần lặp lại của một thử nghiệm, chúng tôi mong đợi kết quả trung bình. Vì vậy, nếu trước đây chúng tôi có kết quả trên trung bình thì chúng tôi mong đợi một kết quả tồi tệ hơn hoặc nếu chúng tôi có kết quả dưới trung bình, chúng tôi mong đợi một kết quả tốt hơn. Điểm mấu chốt là bản thân sự kỳ vọng không phụ thuộc vào bất kỳ lịch sử nào trước đó như trong ngụy biện của người đánh bạc.


Chính xác. Trong bối cảnh của Q này, nếu những người đứng đầu có thể được hiểu là "kết quả tốt", thì trong các ví dụ của OP, kết quả tồi tệ hơn có thể xảy ra sau một chuỗi kết quả tốt và kết quả tốt hơn có thể xảy ra sau một chuỗi kết quả xấu .
amip nói phục hồi Monica

5
Có vẻ như bạn đang mâu thuẫn với chính mình. Bạn nêu the expectation itself does not depend on any previous historyif we previously had an above average outcome then we expect a worse result. Bạn sử dụng từ mong đợi ở cả hai nơi và nói về lịch sử quá khứ / trước đó ở cả hai nơi.
Erik

6
Không có mâu thuẫn. Chúng tôi không mong đợi một kết quả tồi tệ hơn vì các kết quả thực tế phụ thuộc vào nhau, chúng tôi mong đợi một kết quả tồi tệ hơn bởi vì chúng tôi đã thấy một kết quả vượt quá mong đợi của chúng tôi. Bản thân kỳ vọng là không đổi và không thay đổi do kết quả của việc nhìn thấy kết quả trước đó.
DSaxton

@Erik Có lẽ việc viết lại có thể giúp ích, nhưng điểm cần lưu ý là làm thế nào để phân biệt hai khía cạnh. Một, chúng tôi mong đợi một kết quả trung bình, hoặc đúng hơn là tin rằng nó rất có thể. Khi so sánh với một kết quả thực tế, kỳ vọng đó có thể tương đối tốt hoặc xấu tùy thuộc vào kết quả tốt hay xấu so với mong đợi của chúng tôi. Chúng tôi không có thông tin về tương lai! Chúng tôi chỉ so sánh kết quả thực tế của chúng tôi với mức trung bình (comment này bây giờ là không cần thiết, nhưng tôi rời khỏi nó).
wedstrom

9
Không nâng cao, bởi vì câu trả lời của bạn bị mơ hồ khiến câu hỏi ngay từ đầu. Cụ thể, kết quả "tệ hơn" sau kết quả trên trung bình là gì? OP đang giải thích nó là "tồi tệ hơn mức trung bình" (một cách giải thích cảm thấy đúng theo trực giác vì sai lầm thế giới) trong khi hồi quy với nghĩa là nó sẽ "tệ hơn lịch sử". Không xóa nguồn gây nhầm lẫn đó, câu trả lời (chính xác) của bạn chỉ có thể hiểu được đối với những người đã biết câu trả lời đúng. Nếu bạn chỉnh sửa nó dưới một hình thức nào đó, bạn sẽ nhận được upvote của tôi.
rumtscho 30/03/2016

17

Nếu bạn thấy mình ở một vị trí như vậy, với tư cách là một người có lý trí (và giả sử một đồng tiền công bằng), đặt cược tốt nhất của bạn sẽ chỉ là đoán. Nếu bạn thấy mình ở một vị trí như một con bạc mê tín, thì cách tốt nhất của bạn là nhìn vào các sự kiện trước đó và cố gắng biện minh cho lý lẽ của bạn về quá khứ - ví dụ: "Wow, nóng quá , đã đến lúc phải chống đỡ!" hoặc "Không có cách nào chúng ta sẽ thấy một cái đầu khác - xác suất của loại vệt đó là cực kỳ thấp!".

Ngụy biện của người đánh bạc không nhận ra rằng mỗi chuỗi 20 đồng xu cụ thể sẽ khiến chúng ta không thể tin được - chẳng hạn, rất khó có thể lật 10 đầu và sau đó 10 đuôi, rất khó lật đầu và đuôi, rất khó có thể tách ra thành 4, v.v. Thậm chí rất khó có thể lật HHTHHTTTHT .. bởi vì đối với bất kỳ chuỗi nào, chỉ có một cách để điều đó xảy ra với nhiều kết quả khác nhau . Do đó, kết hợp bất kỳ thứ nào trong số này là "có khả năng" hoặc "không có khả năng" là một ngụy biện, vì tất cả chúng đều có thể được trang bị.

Hồi quy về giá trị trung bình là niềm tin có cơ sở đúng đắn rằng về lâu dài, các quan sát của bạn sẽ hội tụ đến một giá trị kỳ vọng hữu hạn. Ví dụ - đặt cược của tôi rằng 10 trong số 20 lần tung đồng xu là một cách tốt vì có nhiều cách để đạt được nó. Đặt cược vào ngày 15 của 20 rất ít khả năng vì có rất ít chuỗi đạt được số cuối cùng đó. Điều đáng chú ý là nếu bạn ngồi xung quanh và lật đồng xu (đủ) đủ lâu, cuối cùng bạn sẽ kết thúc với thứ gì đó khoảng 50/50 - nhưng bạn sẽ không kết thúc với thứ gì đó không có "vệt" hoặc không thể khác sự kiện trong đó. Đó là cốt lõi của sự khác biệt giữa hai khái niệm này.

TL; DR : Hồi quy trung bình cho biết theo thời gian, bạn sẽ kết thúc với một phân phối phản ánh dự kiến ​​trong bất kỳ thử nghiệm nào. Sai lầm của người đánh bạc (sai) nói rằng mỗi lần lật một đồng xu có bộ nhớ như các kết quả trước đó, điều này sẽ ảnh hưởng đến kết quả độc lập tiếp theo.


1
Vì vậy, ngụy biện của Gambler hungs là một khái niệm sai? Tôi không thể có được ý chính của điều đó. Xin lỗi
Luis P.

6
Sai lầm của Gambler là .. à .. một ngụy biện. Đó là sai, đó là lý do xấu. Mặc dù, hồi quy trung bình là số liệu thống kê thuần túy :)
Derek Janni

1
Regression to the mean is the rightly-founded belief that in the long run, your observations should converge to a finite expected value- Đó "ngụy biện của người đánh bạc" - rằng sau một chuỗi những cái đầu, đuôi có nhiều khả năng hơn, bởi vì với một đồng tiền công bằng, nó sẽ hội tụ ...
Izkata 30/03/2016

2
@Izkata Không hẳn. Hồi quy với các trạng thái trung bình rằng với một số lượng lớn các thử nghiệm, các vệt ở hai bên sẽ gần như bị loại bỏ, và càng nhiều thử nghiệm bạn làm càng gần với nghĩa thực mà bạn nhận được. Nếu bạn lật đủ để có một vệt 100 đầu, có lẽ bạn cũng có những vệt đuôi để cân bằng nó ở đâu đó trong bản phân phối của bạn, vì các vệt đầu và đuôi có khả năng như nhau. Quan trọng hơn, hồi quy trung bình không đưa ra các giả định về bất kỳ mốc thời gian cụ thể nào, chỉ trên các giá trị tổng hợp khi kích thước mẫu tăng.
Ethan

1
Sai lầm của @Izkata Gambler đưa ra tuyên bố về những gì sẽ xảy ra với bất kỳ kết quả cụ thể nào, Regression to mean đưa ra tuyên bố chung về những gì chúng ta mong đợi từ nhiều kết quả.
Derek Janni

5

Tôi luôn cố gắng nhớ rằng hồi quy đối với giá trị trung bình không phải là một cơ chế bù cho việc quan sát các ngoại lệ.

Không có mối quan hệ nhân quả giữa việc có một hoạt động đánh bạc xuất sắc, sau đó sẽ tiếp tục 50-50 sau đó. Đó chỉ là một cách hữu ích để nhớ rằng, khi bạn lấy mẫu từ một bản phân phối, rất có thể bạn sẽ thấy các giá trị gần với giá trị trung bình (hãy nghĩ về sự bất bình đẳng của Ch Quashev phải nói ở đây).


2
Yay Ch Quashev! Điểm tuyệt vời!
Derek Janni

4

Đây là một ví dụ đơn giản: bạn đã quyết định ném tổng cộng 200 đồng tiền. Cho đến nay bạn đã ném được 100 trong số chúng và bạn đã vô cùng may mắn: 100% đã ngẩng cao đầu (thật không thể tin được, tôi biết, nhưng hãy cứ để mọi thứ đơn giản).

Có điều kiện trên 100 đầu trong 100 lần ném đầu tiên, bạn dự kiến ​​sẽ có tổng cộng 150 đầu vào cuối trò chơi. Một ví dụ cực đoan về sự ngụy biện của người đánh bạc sẽ nghĩ rằng bạn vẫn chỉ mong đợi tổng số 100 đầu (tức là giá trị dự kiến ​​trước khi bắt đầu trò chơi), ngay cả sau khi nhận được 100 trong 100 lần ném đầu tiên. Các con bạc ngụy biện cho rằng 100 lần tung tiếp theo phải là đuôi. Một ví dụ về hồi quy trung bình (trong bối cảnh này) là tỷ lệ đầu 100% của bạn dự kiến ​​sẽ giảm xuống 150/200 = 75% (tức là về mức trung bình 50%) khi bạn kết thúc trò chơi.


1
@whuber đây không phải là ví dụ về chiều cao của cha và con trai cổ điển, nhưng tôi cho rằng nó thỏa mãn định nghĩa của wikipedia: "hồi quy đối với (hoặc đến) nghĩa là hiện tượng mà nếu một biến [ví dụ đầu phân số trong tung đồng xu] là cực đoan trong lần đo đầu tiên, nó sẽ có xu hướng gần với mức trung bình của lần đo thứ hai "
Adrian

3
Hãy cẩn thận với Wikipedia: ngôn ngữ giới thiệu của nó chỉ nhằm đưa ra một số ý tưởng heuristic, nhưng nó hiếm khi là một định nghĩa. Trên thực tế, trích dẫn của bạn không phải là một định nghĩa (vì nó không nêu rõ "cực đoan" nghĩa là gì) cũng không đúng trong hầu hết các diễn giải. Ví dụ, đối với bất kỳ biến ngẫu nhiên liên tục có chính xác là một cơ hội mà thứ hai trong hai nghiên cứu độc lập là tiếp tục từ giá trị trung bình hơn trước. 1/2
whuber

1
Tôi nghĩ rằng việc cung cấp một mô tả rõ ràng về Ngụy biện của Người đánh bạc và Hồi quy cho Ý nghĩa có thể quan trọng hơn việc đưa ra các ví dụ. Khi chỉ đưa ra các ví dụ, không rõ chúng nên được hiểu như thế nào hoặc chúng liên quan đến hai chủ đề này như thế nào.
whuber

1
Là một người có suy nghĩ tương tự như OP, đoạn thứ hai của bạn là ví dụ duy nhất trong tất cả các câu trả lời giải thích rõ ràng sự khác biệt là gì. Bây giờ nó có ý nghĩa hơn.
Izkata

1
@whuber Đó chính xác là những gì hầu hết các câu trả lời khác đang làm, và họ không làm rõ tất cả cho tôi.
Izkata

2

Tôi có thể sai nhưng tôi luôn nghĩ rằng sự khác biệt nằm ở giả định độc lập.

Trong ngụy biện của Gambler, vấn đề là sự hiểu lầm về sự độc lập. Chắc chắn qua một số lần tung đồng xu N lớn, bạn sẽ bị chia khoảng 50-50, nhưng nếu tình cờ bạn không nghĩ thì việc tung T tiếp theo của bạn sẽ giúp thậm chí bỏ qua các tỷ lệ cược là sai vì mỗi lần tung đồng xu là độc lập với trước đó.

Hồi quy về giá trị trung bình là, nơi tôi thấy nó được sử dụng, một số ý tưởng cho rằng các lần rút là phụ thuộc vào các lần rút trước hoặc giá trị trung bình / giá trị được tính trước đó. Ví dụ: hãy sử dụng tỷ lệ bắn NBA. Nếu người chơi A đã thực hiện trung bình 40% các cú đánh của anh ấy trong sự nghiệp và bắt đầu một năm mới bằng cách bắn 70% trong 5 trận đầu tiên, thật hợp lý khi nghĩ rằng anh ấy sẽ thụt lùi về mức trung bình của sự nghiệp. Có những yếu tố phụ thuộc có thể và sẽ ảnh hưởng đến lối chơi của anh ấy: những vệt nóng / lạnh, lối chơi của đồng đội, sự tự tin và thực tế đơn giản là nếu anh ấy duy trì bắn súng 70% trong năm, anh ấy sẽ hủy diệt hoàn toàn nhiều kỷ lục mà đơn giản là những chiến công không thể (dưới khả năng thực hiện hiện tại của các cầu thủ bóng rổ chuyên nghiệp). Khi bạn chơi nhiều trò chơi, tỷ lệ bắn của bạn sẽ giảm xuống gần mức trung bình của sự nghiệp.


Giải thích của bạn về hồi quy cho âm thanh trung bình giống như một công cụ ước tính co rút. Bạn có thể cung cấp một định nghĩa cụ thể về những gì bạn thực sự có nghĩa là "hồi quy"?
whuber

Tôi đã theo đuổi ý tưởng "Hiện tượng này xảy ra do điểm số của học sinh được xác định một phần bởi khả năng tiềm ẩn và một phần tình cờ" từ Wikipedia. Sự hiểu biết của tôi là trong khi có một mức độ xác suất, kết quả được thúc đẩy bởi một số khả năng cơ bản.
Marsenau

2
Cảm ơn vì bạn đã làm sáng tỏ. Không rõ ràng ý tưởng đó áp dụng như thế nào cho ý tưởng rằng khi sự nghiệp của một người tiến bộ, trung bình của một người tiến gần hơn đến mức trung bình của sự nghiệp. Nghe có vẻ giống như tautology hoặc một số phiên bản của luật số lượng lớn. Trên thực tế, nó nghe có vẻ khủng khiếp như chính Fallacy của Gambler!
whuber

1
Hoặc trung bình nghề nghiệp của bạn sẽ tăng lên để đáp ứng khả năng mới của bạn. :) Tôi nghĩ rằng đó là một sai lầm để làm vẩn đục nước với một kỹ năng ngẫu hứng.
Erik

1
"hiểu lầm về độc lập" - điều này dường như là điểm quan trọng. Hồi quy trung bình xuất hiện để làm cho các sự kiện độc lập phụ thuộc.
icc97

2

Điều quan trọng là chúng tôi không có bất kỳ thông tin nào sẽ giúp chúng tôi với sự kiện tiếp theo (ngụy biện của người đánh bạc), vì sự kiện tiếp theo không phụ thuộc vào sự kiện trước đó. Chúng ta có thể đoán hợp lý về một loạt các thử nghiệm sẽ diễn ra như thế nào. Dự đoán hợp lý này là trung bình aka kết quả trung bình dự kiến ​​của chúng tôi. Vì vậy, khi chúng ta theo dõi độ lệch trong xu hướng trung bình trở lại trung bình, theo thời gian / thử nghiệm, thì chúng ta chứng kiến ​​một hồi quy với giá trị trung bình.

Như bạn có thể thấy hồi quy trung bình là một chuỗi các hành động được quan sát , nó không phải là một công cụ dự đoán. Khi nhiều thử nghiệm được tiến hành, mọi thứ sẽ gần đúng hơn với phân phối Gaussian bình thường. Điều này có nghĩa là tôi không đưa ra bất kỳ giả định hoặc đoán xem kết quả tiếp theo sẽ là gì. Sử dụng định luật về số lượng lớn tôi có thể đưa ra giả thuyết rằng mặc dù mọi thứ có thể đang là xu hướng hiện tại, theo thời gian, mọi thứ sẽ tự cân bằng. Khi họ tự cân bằng ra, tập kết quả đã thoái lui về mức trung bình. Điều quan trọng cần lưu ý ở đây là chúng tôi không nói rằng các thử nghiệm trong tương lai phụ thuộc vào kết quả trong quá khứ. Tôi chỉ đang quan sát một sự thay đổi trong sự cân bằng của dữ liệu.

Sự ngu dốt của người đánh bạc vì tôi hiểu nó ngay lập tức hơn trong các mục tiêu của nó và tập trung vào dự đoán các sự kiện trong tương lai. Điều này theo dõi với những gì một con bạc mong muốn. Thông thường, các trò chơi may rủi sẽ nghiêng về phía con bạc trong thời gian dài, vì vậy một con bạc muốn biết thử nghiệm tiếp theo sẽ là gì vì họ muốn tận dụng kiến ​​thức này. Điều này dẫn đến việc con bạc giả định rằng thử nghiệm tiếp theo phụ thuộc vào thử nghiệm trước đó. Điều này có thể dẫn đến các lựa chọn trung lập như:

Năm lần cuối cùng bánh xe roulette rơi xuống màu đen, do đó, lần tới tôi sẽ đặt cược lớn vào màu đỏ.

Hoặc sự lựa chọn có thể tự phục vụ:

Tôi đã nhận được một ngôi nhà đầy đủ trong 5 bàn tay cuối cùng, vì vậy tôi sẽ đặt cược lớn vì tôi đang thắng và không thể thua.


Vì vậy, như bạn có thể thấy có một vài khác biệt chính:

  1. Hồi quy trung bình không cho rằng các thử nghiệm độc lập phụ thuộc như ngụy biện của con bạc.

  2. Hồi quy trung bình được áp dụng trên một lượng lớn dữ liệu / thử nghiệm, trong đó sai lầm của người đánh bạc có liên quan đến thử nghiệm tiếp theo.

  3. Hồi quy trung bình mô tả những gì đã diễn ra. Sai lầm của người đánh bạc cố gắng dự đoán tương lai dựa trên mức trung bình dự kiến ​​và kết quả trong quá khứ.


1
Trên thực tế tôi không nghĩ rằng hồi quy trung bình có liên quan đến luật số lượng lớn hoặc nó biểu thị những gì bạn nói trong câu đầu tiên.
amip nói phục hồi Monica

@amoeba vì vậy nếu chúng ta có kế hoạch lật một đồng xu 100 lần và 20 lần lật vào thử nghiệm, chúng ta có 20 người đứng đầu. Kết thúc phiên tòa chúng tôi có 55 người đứng đầu. Tôi cố gắng nói rằng đây sẽ là một ví dụ về "hồi quy trung bình". Nó bắt đầu lop-side nhưng theo thời gian nó bình thường hóa. Định luật về số lượng lớn bit là một cách khác để thể hiện ý tưởng rằng mọi thứ sẽ vượt qua đủ các thử nghiệm, giống như việc mất cân bằng ban đầu sẽ cân bằng theo thời gian hoặc thoái lui theo giá trị trung bình.
Erik

1
Tôi đoán rằng tôi đang bắt đầu nhận được ý chính của các chủ đề đó bằng các phím của bạn, Erik. Đẹp! :) xxx
Luis P.

2

Là những học sinh có điểm cao hơn, những người có điểm kém hơn trong các cuộc thi lại?

Câu hỏi đã nhận được một chỉnh sửa đáng kể kể từ cuối sáu câu trả lời.

100

Hay họ chỉ nên tránh xa bánh xe roulette?

50%50%10050

60%2.8%30006085

8560%50%10060%2.8%2852.8%8560%

50%1005050

Tiền may mắn và lật may mắn

100055%G100045%B) và 1000 có xác suất bằng nhau là đầu hoặc đuôi (tiền công bằng F) và phân phối ngẫu nhiên những thứ này. Điều này tương tự với giả định khả năng / kiến ​​thức cao hơn và thấp hơn trong ví dụ lấy bài kiểm tra, nhưng sẽ dễ dàng hơn để lý luận chính xác về các đối tượng vô tri.

Điểm số dự kiến ​​là (551000+451000+501000)/3000= =50cho bất kỳ sinh viên đưa ra phân phối ngẫu nhiên. Vì vậy, điểm số dự kiến ​​cho bài kiểm tra đầu tiên không thay đổi. Bây giờ, xác suất ghi bàn ít nhất60% chính xác, một lần nữa sử dụng phân phối nhị thức là 18.3% cho tiền tốt, 0,2% đối với những đồng tiền xấu, và tất nhiên 2,8%vẫn cho các đồng tiền công bằng. Xác suất ghi bàn ít nhất60% là, vì một số lượng bằng nhau của từng loại tiền được phân phối ngẫu nhiên, trung bình của các loại này, hoặc 7.1%. Số lượng học sinh dự kiến ​​đạt ít nhất60% đúng là 21.

Bây giờ, nếu chúng ta thực sự có 21 ghi ít nhất 60%chính xác theo thiết lập của các đồng tiền thiên vị này, điểm số dự kiến ​​khi thi lại là gì? không phải50% của 100 anymore! Now you can work it out with Bayes theorem, but since we used equal size groups the probability of having a type of coin given a outcome is (here) proportional to the probability of the outcome given the type of coin. In other words, there is a 86%=18.3%/(18.3%+0.2%+2.8%) chance that those scoring at least 60% had a good coin, 1%=0.2%/(18.3%+0.2%+2.8%) had a bad coin, and 13% had a fair coin. The expected value of scores on retest is therefore 86%55+1%45+13%50=54.25 out of 100. This is lower than actual scores of the first round, at least 60, but higher than the expected value of scores before the first round, 50.

So even when some coins are better than others, randomness in the coin flips means that selecting the top performers from a test will still exhibit some regression to the mean in a retest. In this modified model, hot-handedness is no longer an outright fallacy -- scoring better in the first round does mean a higher probability of having a good coin! However, gambler's fallacy is still a fallacy -- those who experienced good luck cannot be expected to be compensated with bad luck on retest.


I've just got an idea. I'm gonna simulate that model and see how it works.
Luis P.

1

Họ đang nói điều tương tự. Bạn hầu như bối rối vì không có thử nghiệm đơn lẻ nào trong ví dụ lật đồng xu có kết quả cực đoan (H / T 50/50). Thay đổi nó thành "lật mười đồng tiền công bằng cùng một lúc trong mọi thử nghiệm" và người đánh bạc muốn có được tất cả chúng đúng. Sau đó, một phép đo cực đoan sẽ là bạn tình cờ thấy tất cả chúng đều là đầu.

Sai lầm của người đánh bạc: Xử lý từng kết quả đánh bạc (kết quả lật đồng xu) là IID . Nếu bạn đã biết phân phối các cổ phiếu IID đó, thì dự đoán tiếp theo sẽ đến trực tiếp từ phân phối đã biết và không liên quan gì đến kết quả lịch sử (hoặc tương lai) (còn gọi là IID khác).

Hồi quy trung bình: Xử lý từng kết quả kiểm tra là IID (vì học sinh được cho là đoán ngẫu nhiên và không có kỹ năng thực sự). Nếu bạn đã biết phân phối các cổ phiếu IID đó, thì dự đoán tiếp theo xuất phát trực tiếp từ phân phối đã biết và không liên quan gì đến kết quả lịch sử (hoặc tương lai) (còn gọi là IID khác) ( chính xác như trước đây ). Nhưng, bởi CLT , nếu bạn quan sát các giá trị cực đoan trong một phép đo (ví dụ như tình cờ bạn chỉ lấy mẫu 10% sinh viên hàng đầu từ bài kiểm tra đầu tiên), bạn sẽ biết kết quả từ lần quan sát / đo lường tiếp theo của bạn sẽ vẫn được tạo ra từ kết quả đã biết phân phối (và do đó có nhiều khả năng gần với giá trị trung bình hơn là ở mức cực đoan).

Vì vậy, về cơ bản, cả hai đều nói rằng phép đo tiếp theo sẽ đến từ phân phối thay vì kết quả trong quá khứ.


Đây không phải là một trích dẫn chính xác của định lý giới hạn trung tâm. Nó chỉ đơn thuần là một tuyên bố về những gì một sự kiện độc lập.
AdamO

0

Let X and Y be two i.i.d. uniform random variables on [0,1]. Suppose we observe them one after another.

Gambler's Fallacy: P( Y | X ) != P( Y ) This is, of course, nonsense because X and Y are independent.

Regression to the mean: P( Y < X | X = 1) != P( Y < X ) This is true: LHS is 1, LHS < 1


0

Cảm ơn câu trả lời của bạn Tôi nghĩ rằng tôi có thể hiểu được sự khác biệt giữa Hồi quy với giá trị trung bình và sai lầm của Gambler. Thậm chí, tôi còn xây dựng một cơ sở dữ liệu để giúp tôi minh họa trong trường hợp "thực".

Tôi đã xây dựng tình huống này: Tôi đã thu thập 1000 sinh viên và tôi đưa họ làm một bài kiểm tra trả lời ngẫu nhiên các câu hỏi.

Điểm kiểm tra nằm trong khoảng từ 01 đến 05. Vì họ đang trả lời ngẫu nhiên các câu hỏi, vì vậy mỗi điểm có 20% cơ hội đạt được. Vì vậy, đối với bài kiểm tra đầu tiên, số học sinh có điểm 05 phải là gần 200

(1.1) 1000*0,20

(1.2) 200

Tôi có 196 học sinh với số điểm 05 rất gần với 200 học sinh dự kiến.

Vì vậy, tôi đặt 196 học sinh đó lặp lại bài kiểm tra đã khiến 39 học sinh bị điểm 05.

(2.1) 196*0,20

(2.2) 39

Vâng, theo kết quả, tôi đã nhận được 42 sinh viên trong dự kiến.

Đối với những người đạt điểm 05, tôi đặt họ để lặp lại bài kiểm tra và cứ thế ...

Do đó, những con số dự kiến ​​là:

Dự kiến ​​RETEST 03

(3.1) 42*0,20

(3.2) số 8

(3.3) Kết quả (8)

Dự kiến ​​ngày 04

(4.1) số 8*0,20

(4.2) 1,2

(4.3) Kết quả (2)

Dự kiến ​​RETEST 05

(4.1) 2*0,20

(4.2) 0,1

(4.3) Kết quả (0)

Nếu tôi mong đợi một học sinh đạt điểm 05 bốn lần, tôi sẽ phải đối mặt với xác suất 0,204, tức là 1,2 sinh viên trên 1000. Tuy nhiên, nếu tôi mong đợi một sinh viên đạt điểm 05 năm lần, tôi nên có ít nhất 3.500 mẫu để có được 1.12 sinh viên có điểm 05 trong tất cả các bài kiểm tra

(5.1.) 0,205= =0,00032

(5.2.) 0,00032*3500= =1.2

Do đó, xác suất một học sinh đạt điểm 05 trong tất cả 05 bài kiểm tra không liên quan gì đến điểm cuối cùng của anh ta, ý tôi là, tôi không được tính xác suất cho mỗi bài kiểm tra đơn lẻ. Tôi phải tìm kiếm 05 bài kiểm tra như một sự kiện và tính xác suất cho sự kiện đó.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.