Trong [1, §3.2], David Freedman cho thấy một chất âm câu trả lời cho câu hỏi của bạn. Đó là, không có mô hình thống kê hoặc thuật toán thống kê nào có thể giải quyết vấn đề của John Snow. Vấn đề của Snow là phát triển một lập luận phê phán ủng hộ lý thuyết của ông rằng dịch tả là một bệnh truyền nhiễm do nước gây ra, chống lại lý thuyết miasma phổ biến trong thời đại của ông. (Chương 3 trong [1], có tiêu đề Mô hình thống kê và Giày da, có sẵn ở dạng đã xuất bản trước đây [2] tại đây .)
Trong vài trang ngắn này [1, tr.47 Ném53], phần lớn trong số đó là một trích dẫn mở rộng từ chính John Snow, Freedman lập luận rằng "những gì Snow thực sự đã làm vào năm 1853 Ném54 thậm chí còn thú vị hơn cả truyện ngụ ngôn [của Broad Bơm đường phố]. " Theo như bằng chứng thống kê thống kê (các sơ khảo khác như xác định trường hợp chỉ số, v.v., được thảo luận bên cạnh), Snow đã khai thác biến thể tự nhiên để thực hiện một thí nghiệm gần như thực sự đáng chú ý.
Nó chỉ ra rằng vào thời điểm trước đó, có một sự cạnh tranh mạnh mẽ giữa các công ty cấp nước ở London và điều này dẫn đến sự pha trộn không gian của nguồn cung cấp nước (theo cách nói của Snow) "thuộc loại thân mật nhất".
Các đường ống của mỗi Công ty đi xuống tất cả các đường phố, và vào gần như tất cả các tòa án và ngõ nhỏ. Một vài ngôi nhà được cung cấp bởi một Công ty và một số ít bởi một Công ty khác, theo quyết định của chủ sở hữu hoặc người thuê nhà tại thời điểm đó khi các Công ty Nước đang cạnh tranh tích cực.
...
Vì không có sự khác biệt nào trong nhà hoặc người dân nhận được sự cung cấp của hai Công ty Nước, hoặc trong bất kỳ điều kiện vật lý nào mà họ bị bao vây, rõ ràng là không có thí nghiệm nào có thể được đưa ra để kiểm tra kỹ lưỡng hơn ảnh hưởng của việc cung cấp nước đến sự tiến triển của bệnh tả hơn thế này, hoàn cảnh được đặt sẵn trước người quan sát.
TuyếtJohn
Một phần cực kỳ quan trọng khác của "biến thiên tự nhiên" John Snow khai thác trong thí nghiệm gần đây này là một công ty nước có lượng nước của nó ở hạ lưu sông Thames , trong khi công ty kia đã vài năm trước khi di chuyển vào thượng nguồn . Tôi sẽ cho bạn đoán đó là cái gì từ bảng dữ liệu của John Snow!
| Số lượng | Dịch tả | Tử vong mỗi
Công ty | nhà ở | tử vong | 10.000 căn nhà
-------------------------------------------------- --------
Southwark & Vauxhall | 40.046 | 1263 | 315
Lambeth | 26.107 | 98 | 37
Phần còn lại của Luân Đôn | 256,423 | 1422 | 59
Như Freedman ghi chú héo úa,
Là một phần của công nghệ thống kê, [bảng trên] không có nghĩa là đáng chú ý. Nhưng câu chuyện nó kể rất thuyết phục. Sức mạnh của cuộc tranh luận là kết quả của sự rõ ràng của lý do trước đó, tập hợp nhiều bằng chứng khác nhau và số lượng giày da mà Snow sẵn sàng sử dụng để lấy dữ liệu. [1, tr.51]
Một điểm nữa của biến thiên tự nhiên được khai thác bởi Snow xảy ra theo chiều thời gian : việc di chuyển lượng nước đã nói ở trên xảy ra giữa hai dịch bệnh, cho phép Snow so sánh nước của cùng một công ty với và không cần thêm nước thải. (Cảm ơn Philip B. Stark, một tác giả của [1], về thông tin này qua Twitter . Xem bài giảng trực tuyến này của anh ấy.)
Vấn đề này cũng cung cấp một nghiên cứu mang tính hướng dẫn trong sự tương phản giữa chủ nghĩa khấu trừ và quy nạp , như được thảo luận trong câu trả lời này .
Freedman D, Collier D, Sekhon JS, PB Stark. Mô hình thống kê và suy luận nguyên nhân: Đối thoại với khoa học xã hội. Cambridge; New York: Nhà xuất bản Đại học Cambridge; 2010.
Người tự do DA. Mô hình thống kê và da giày. Phương pháp xã hội học . 1991; 21: 29-13. doi: 10.2307 / 270939. Toàn văn