(Câu trả lời này đã được viết lại hoàn toàn để rõ ràng hơn và dễ đọc hơn vào tháng 7 năm 2017.)
Lật một đồng xu 100 lần liên tiếp.
p^(H|3T)p^(H|3H)
x:=p^(H|3H)−p^(H|3T)
Nếu các lần lật đồng xu là iid, thì "rõ ràng", qua nhiều chuỗi 100 lần lật đồng xu,
x>0x<0
E(X)=0
Chúng tôi tạo ra một triệu chuỗi 100 lần lật và nhận được hai kết quả sau:
x>0x<0
x¯≈0x¯x
Và vì vậy, chúng tôi kết luận rằng các đồng xu lật thực sự là iid và không có bằng chứng nào về một bàn tay nóng. Đây là những gì GVT (1985) đã làm (nhưng với những cú đánh bóng rổ thay cho những cú lật đồng xu). Và đây là cách họ kết luận rằng bàn tay nóng không tồn tại.
Punchline: Thật sốc, (1) và (2) không chính xác. Nếu lật đồng xu là iid, thì thay vào đó nên là
x>0x<0x=0x
E(X)≈−0.08
Trực giác (hoặc phản trực giác) có liên quan tương tự như trong một số câu đố xác suất nổi tiếng khác: vấn đề Monty Hall, vấn đề hai chàng trai và nguyên tắc lựa chọn hạn chế (trong cầu trò chơi bài). Câu trả lời này đã đủ dài và vì vậy tôi sẽ bỏ qua phần giải thích về trực giác này.
Và do đó, kết quả (I) và (II) mà GVT (1985) thu được thực sự là bằng chứng mạnh mẽ ủng hộ bàn tay nóng. Đây là những gì Miller và Sanjurjo (2015) đã thể hiện.
Phân tích sâu hơn về Bảng 4 của GVT.
Nhiều người (ví dụ @scerwin dưới đây) - không bận tâm đến việc đọc GVT (1985) - bày tỏ sự không tin rằng bất kỳ "nhà thống kê được đào tạo nào cũng sẽ" lấy trung bình trung bình trong bối cảnh này.
Nhưng đó chính xác là những gì GVT (1985) đã làm trong Bảng 4. Xem Bảng 4, cột 2-4 và 5-6, hàng dưới cùng của họ. Họ thấy rằng trung bình trên 26 người chơi,
p^(H|1M)≈0.47p^(H|1H)≈0.48
p^(H|2M)≈0.47p^(H|2H)≈0.49
p^(H|3M)≈0.45p^(H|3H)≈0.49
k=1,2,3p^(H|kH)>p^(H|kM)
Nhưng nếu thay vì lấy trung bình trung bình (một động thái được coi là ngu ngốc không thể tin được bởi một số người), chúng tôi đã làm lại phân tích của họ và tổng hợp qua 26 người chơi (với 100 lần chụp, với một số ngoại lệ), chúng tôi sẽ nhận được bảng trung bình có trọng số sau.
Any 1175/2515 = 0.4672
3 misses in a row 161/400 = 0.4025
3 hits in a row 179/313 = 0.5719
2 misses in a row 315/719 = 0.4381
2 hits in a row 316/581 = 0.5439
1 miss in a row 592/1317 = 0.4495
1 hit in a row 581/1150 = 0.5052
Bảng cho biết, ví dụ, tổng cộng 2.515 bức ảnh được chụp bởi 26 người chơi, trong đó có 1.175 hoặc 46,72% được thực hiện.
Và trong số 400 trường hợp người chơi bỏ lỡ 3 lần liên tiếp, 161 hoặc 40,25% ngay lập tức bị tấn công. Và trong số 313 trường hợp người chơi đạt 3 điểm liên tiếp, 179 hoặc 57,19% ngay lập tức bị tấn công.
Các trung bình có trọng số trên dường như là bằng chứng mạnh mẽ ủng hộ bàn tay nóng.
Hãy nhớ rằng thử nghiệm bắn súng đã được thiết lập để mỗi người chơi bắn từ nơi được xác định rằng anh ấy / cô ấy có thể thực hiện khoảng 50% các bức ảnh của mình.
(Lưu ý: "Thật kỳ lạ", trong Bảng 1 cho một phân tích rất giống với trò bắn súng trong trò chơi của Sixers, GVT thay vào đó đưa ra mức trung bình có trọng số. Vậy tại sao họ không làm như vậy cho Bảng 4? Tôi đoán là họ chắc chắn đã tính trung bình có trọng số cho Bảng 4 - những con số tôi trình bày ở trên, không giống như những gì họ thấy và chọn cách triệt tiêu chúng. Loại hành vi này không may là ngang bằng với khóa học ở học viện.)
HHHTTTHHHHH…Hp^(H|3T)=1/1=1
p^(H|3H)=91/92≈0.989
Bảng 4 của PS GVT (1985) có một số lỗi. Tôi phát hiện ít nhất hai lỗi làm tròn. Và đối với người chơi 10, các giá trị gốc trong cột 4 và 6 không cộng ít hơn một giá trị trong cột 5 (trái với ghi chú ở phía dưới). Tôi đã liên lạc với Gilovich (Tversky đã chết và tôi không chắc chắn về điều đó), nhưng thật không may, anh ta không còn có các chuỗi hit và miss ban đầu. Bảng 4 là tất cả những gì chúng ta có.