Dữ liệu lật John Kerrich


12

Bất cứ ai cũng có thể đề xuất nơi để có được kết quả của 10.000 lần lật đồng xu (tức là tất cả 10.000 đầu và đuôi) được thực hiện bởi John Kerrich trong Thế chiến II?


1
Cho rằng anh ta bị nhốt trong nhà tù của Đức Quốc xã vào thời điểm đó, tôi tự hỏi liệu anh ta có đủ giấy để ghi lại tất cả 10k kết quả hay không, nếu anh ta chỉ thực sự viết ra các giá trị tóm tắt.
Corone

6
Kết quả @Corone 10K có thể dễ dàng được ghi lại trên một tờ giấy tiêu chuẩn bằng cách sử dụng dấu chấm và mã vạch (như trong ||||..|....||.|..||.vv). Điều này có thể được nén bằng cách sử dụng (ví dụ) thập lục phân. Trong ví dụ trước, |đặt 1 và .0, biểu diễn hex là f21a6. Bằng cách viết các ký tự nhỏ nhưng có thể nhìn thấy, tôi có thể dễ dàng ghép 50 ký tự như vậy trong một dòng viết và 50 dòng trên một tờ, từ đó biểu thị một chuỗi kết quả 50 * 50 * 4 = 10K.
whuber

2
@whuber haha, vâng tôi bắt đầu suy nghĩ những điều tương tự sau khi nhận xét của tôi. Tôi nghi ngờ rằng trong thời kỳ tiền máy tính, thập lục phân sẽ xuất hiện trong tâm trí như bây giờ, mặc dù bát phân vẫn sẽ cho bạn cơ hội. Tuy nhiên, tôi đã cho nó đi và chấm và gạch ngang một mình tôi có thể nhận được hơn 100 trên một tờ, vì vậy nếu anh ta sử dụng cả hai mặt thì 10K sẽ vừa vặn. Có lẽ đó là lý do tại sao anh ấy dừng lại ở 10K!
Corone

Một nhà tù của Đức quốc xã, vâng, nhưng ở Đan Mạch, đó không phải là một trại hủy diệt ...
kjetil b halvorsen 17/03/2015

@kjetilbhalvorsen - thực sự là một trại tù Đan Mạch ở Hald với lính canh Đan Mạch, v.v. để bảo vệ các thực tập sinh khỏi người Đức
Henry

Câu trả lời:


13

Tôi chưa từng nghe về Kerrich trước đây-- thật là một câu chuyện kỳ ​​quái. Quá trình quét sách của Google (được chia sẻ bởi reftt) của "Giới thiệu thử nghiệm về lý thuyết xác suất" dường như không bao gồm phần thân của văn bản. Cảm thấy hơi lỗi thời, tôi đã kiểm tra một bản sao của phiên bản 1950 từ thư viện.

Tôi đã quét một vài trang mà tôi thấy thú vị. Các trang mô tả các điều kiện thử nghiệm của anh ấy, dữ liệu từ 2000 lần lật đồng xu đầu tiên và dữ liệu từ 500 lần đầu tiên trong chuỗi 5000 thí nghiệm phát ra âm thanh không thể tin được (với 2 quả bóng bàn màu đỏ và 2 quả bóng màu xanh lá cây).


Nhận dạng văn bản (và một số dọn dẹp) bằng Mathicala 9 cung cấp chuỗi 2000 đuôi (0) và đầu (1) từ Bảng 1. Tổng số đầu của 1014 là nhiều hơn 502 + 511 = 1013 trong Bảng 2, do đó, nhận dạng là không hoàn hảo, nhưng có vẻ khá tốt - ít nhất là nó có đúng số lượng nhân vật! (Độc giả tinh mắt được mời để sửa nó.)

Dưới đây là một bản tóm tắt đồ họa của bước đi ngẫu nhiên này, tiếp theo là dữ liệu. Sự khác biệt tích lũy giữa số lượng đầu và đuôi tiến hành từ trái sang phải, bao gồm tất cả 2000 kết quả.

Figure

00011101001111101000110101111000100111001000001110
00101010100100001001100010000111010100010000101101
01110100001101001010000011111011111001101100101011
01010000011000111001111101101010110100110110110110
01111100001110110001010010000010100111111011101011
10001100011000110001100110100100001000011101111000
11111110000000001101011010011111011110010010101100
11101101110010000010001100101100111110100111100010
00001001101011101010110011111011001000001101011111
11010001111110010111111001110011111111010000100000
00001111100101010111100001110111001000110100001111
11000101001111111101101110110111011010010110110011
01010011011111110010111000111101111111000001001001
01001110111011011011111100000101010101010101001001
11101101110011100000001001101010011001000100001100
10111100010011010110110111001101001010100000010000
00001011001101011011111000101100101000011100110011
11100101011010000110001001100010010001100100001001
01000011100000011101101111001110011010101101001011
01000001110110100010001110010011100001010000000010
10010001011000010010100011111101101111010101010000
01100010100000100000000010000001100100011011101010
11011000110111010110010010111000101101101010110110
00001011011101010101000011100111000110100111011101
10001101110000010011110001110100001010000111110100
00111111111111010101001001100010111100101010001111
11000110101010011010010111110000111011110110011001
11111010000011101010111101101011100001000101101001
10011010000101111101111010110011011110000010110010
00110110101111101011100101001101100100011000011000
01010011000110100111010000011001100011101011100001
11010111011110101101101111001111011100011011010000
01011110100111011001001110001111011000011110011111
01101011101110011011100011001111001011101010010010
10100011010111011000111110000011000000010011101011
10001011101000101111110111000001111111011000000010
10111111011100010000110000110001111101001110110000
00001111011100011101010001011000110111010001110111
10000010000110100000101000010101000101100010111100
00101110010111010010110010110100011000001110000111

3
Không có gì. Tôi đã xếp chồng một biểu đồ của những dữ liệu này lên hình ảnh được quét của bạn, hy vọng nó sẽ làm cho bất kỳ sự khác biệt nào trở nên rõ ràng, nhưng tôi không thể tìm thấy bất kỳ sự khác biệt nào cả. Hoặc là không có lỗi và Kerrich miscounted hoặc tôi chỉ không thể tìm thấy lỗi, nhưng trong bất kỳ trường hợp các dữ liệu được đăng ở đây là một việc vẽ chữ chính xác của Bảng mình 1.
whuber

4

Bài trình bày này cho thấy dữ liệu cho các khoảng thời gian tung. Nó cũng tham khảo nguồn chính từ Kerrich.


2
Nguồn gốc của dữ liệu (tóm tắt) trong bản trình bày đó là Freedman, Pisani, & Purves Statistics (bất kỳ phiên bản nào). Tuy nhiên, đây chỉ là một bản tóm tắt, không phải là một tài khoản của tất cả các kết quả được yêu cầu ở đây. Kerrich đã công bố kết quả của mình vào năm 1946 trong một cuốn sách nhỏ; Google đã số hóa nó .
whuber

Giống như tôi đã nói, nó có dữ liệu cho "khoảng thời gian tung" và phần trình bày tham khảo chuyên khảo của Kerrich nơi ông đã công bố kết quả của mình. Tôi không biết nếu Kerrich công bố danh sách mỗi lần tung. Hình này ít nhất hữu ích hơn so với tỷ lệ chung.

@whuber: vâng, đó là chuyên khảo được tham chiếu trong bài thuyết trình. nó dường như có sẵn hạn chế. có ai tìm thấy pdf không?

2

Có một tài liệu tham khảo khác về Kerrich trong cuốn sách "Cơ hội gặp gỡ: Khóa học đầu tiên về phân tích và suy luận dữ liệu" của Chris Wild và George Seber nói trong chương 4 (có thể tải xuống bổ sung từ trang này ) rằng dữ liệu được xuất bản trong Kerrich [1964] và Freedman [1991, Bảng 1, tr. 248]. Cuốn sách Kerrich có lẽ là một Giới thiệu thử nghiệm về Lý thuyết xác suất , và Freedman là cùng một cuốn sách giáo khoa đã được đề cập. Tôi nghi ngờ rằng chuyên khảo năm 1964 sẽ chứa nhiều dữ liệu hơn năm 1946.


2

Cuốn sách đó của Kerrich có thể được mua được sử dụng từ Amazon, nhưng giá niêm yết khá cứng!

Một lựa chọn tốt hơn là https: // openl Library.org
Bạn cần tạo một tài khoản ở đó, sau đó cài đặt Adobe Digital Editions để đọc sách. (có vẻ như không có chương trình nào khác sẽ làm, cuốn sách được tải xuống có DRM, quản lý hạn chế kỹ thuật số). Sau đó, bạn có thể tải xuống ("mượn") cuốn sách. Tôi đang đọc nó ngay bây giờ. Tôi đoán rằng tôi có thể lấy một bản sao màn hình của các trang với kết quả và sử dụng ocr trên đó. Cho sau này ...

(Không, tôi đã lướt qua cuốn sách rất nhiều , trong cùng một tinh thần.


3
Không rõ liệu bạn có nhận thấy rằng 2000 kết quả cá nhân đầu tiên đã có sẵn trong chủ đề này theo câu trả lời của Bill Bradley hay không . Cuốn sách xuất hiện trong sách của Google; Tôi đã cung cấp một liên kết trong một bình luận khác . Hiện tại Google liên kết với các nhà bán sách khác, ngoài Amazon, nơi giá niêm yết (bao gồm cả vận chuyển) rẻ hơn đáng kể.
whuber

Cảm ơn, tôi đã lưu ý 2000 lần ném ở những nơi có sẵn ở trên, nhưng hy vọng tôi có thể tìm thấy nhiều hơn trong cuốn sách. Có vẻ không. Tôi không thể đọc sách qua sách google, có thể việc truy cập đó phụ thuộc vào địa lý? Bằng cách này, bây giờ tôi trở lại vay của tôi từ openlibrary, để những người khác có thể thử ...
Kjetil b Halvorsen

1
Tôi đã cố gắng điều tương tự khi chủ đề này xuất hiện, với kết quả tiêu cực tương tự. :-( Tôi không có ý thân mật rằng chúng tôi thực sự có thể đọc phiên bản trên sách của Google: đó chỉ là loại có thể tìm kiếm. Giá trị chính của GB (ít nhất là cho đến khi thay đổi chính sách của Google) là cung cấp liên kết đến những nơi chúng tôi có thể mua nó.
whuber

1

Tôi đã bắt gặp điều này khi thực hiện một số nghiên cứu cơ bản về Kerrich. Tôi lấy dữ liệu từ câu trả lời của Bill Bradley - thực sự đánh giá cao rằng dữ liệu đã được số hóa! Tôi đã thêm dữ liệu vào gói R mà tôi sử dụng để giảng dạy, có sẵn trên GitHub .

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.