Làm thế nào lẻ ​​là một cụm tai nạn máy bay?


15

Câu hỏi ban đầu (25/11/14): Liệu trích dẫn này từ các phương tiện truyền thông có ý nghĩa hay không, có cách thống kê nào tốt hơn để xem các tai nạn máy bay gần đây không?

Tuy nhiên, Barnett cũng thu hút sự chú ý đến lý thuyết phân phối Poisson, ngụ ý rằng khoảng thời gian ngắn giữa các sự cố thực sự có nhiều khả năng hơn so với thời gian dài.

"Giả sử rằng trung bình có một tai nạn chết người mỗi năm, có nghĩa là khả năng xảy ra tai nạn vào bất kỳ ngày nào là một trong 365", ông Barnett nói. "Nếu xảy ra sự cố vào ngày 1 tháng 8, khả năng vụ tai nạn tiếp theo xảy ra vào một ngày sau đó vào ngày 2 tháng 8 là 1/365. Nhưng khả năng vụ tai nạn tiếp theo là vào ngày 3 tháng 8 là (364/365) x (1/365) , bởi vì vụ tai nạn tiếp theo xảy ra vào ngày 3 tháng 8 chỉ khi không có vụ tai nạn nào vào ngày 2 tháng 8. "

"Nó có vẻ phản trực giác, nhưng kết luận không ngừng theo quy luật xác suất", ông Barnett nói.

Nguồn: http://www.bbc.com/news/magazine-28481060

Làm rõ (27/07/14): Điều gì là phản trực giác (với tôi) đang nói rằng các sự kiện hiếm có xu hướng xảy ra gần đúng lúc. Theo trực giác, tôi sẽ nghĩ rằng các sự kiện hiếm hoi sẽ không xảy ra gần đúng lúc. Bất cứ ai cũng có thể chỉ cho tôi một phân phối dự kiến ​​theo lý thuyết hoặc theo kinh nghiệm về thời gian giữa các sự kiện theo các giả định của phân phối Poisson? (Nghĩa là, biểu đồ trong đó trục y là tần số hoặc xác suất và trục x là thời gian giữa 2 lần xuất hiện liên tiếp được nhóm thành ngày, tuần, tháng hoặc năm hoặc tương tự.) Cảm ơn.

Làm rõ (28/11/14): Dòng tiêu đề ngụ ý rằng nó có nhiều khả năng xảy ra các vụ tai nạn hơn là các vụ tai nạn xảy ra trên diện rộng. Hãy vận hành nó. Giả sử một cụm là 3 tai nạn máy bay và một khoảng thời gian ngắn là 3 tháng và một khoảng thời gian dài là 3 năm. Có vẻ phi logic khi nghĩ rằng có khả năng cao hơn là 3 vụ tai nạn sẽ xảy ra trong khoảng thời gian 3 tháng so với trong khoảng thời gian 3 năm. Ngay cả khi chúng tôi nhận tai nạn đầu tiên như một sự cho trước, thật phi lý khi nghĩ rằng sẽ có thêm 2 vụ tai nạn xảy ra trong vòng 3 tháng tới so với trong vòng 3 năm tới. Nếu đó là sự thật, thì tiêu đề truyền thông tin tức là sai lệch và không chính xác. Tui bỏ lỡ điều gì vậy?


1
Làm rõ lại: Bạn có thể thấy hữu ích khi phân biệt giữa xác suất , xác suất trên mỗi đơn vị thời giankỳ vọng . Mặc dù các quy trình mô tả các sự kiện hiếm sẽ - thực tế theo nghĩa "hiếm" - có thời gian dự kiến dài giữa các sự kiện, điều đó không phù hợp với xác suất mỗi đơn vị thời gian là lớn nhất ngay từ đầu. Tuy nhiên, xác suất của sự kiện tiếp theo xảy ra trong một thời gian ngắn sẽ rất nhỏ.
whuber

2
Ngoài ra, tôi chỉ nhận thấy bài viết Wikipedia này - bạn có thể thích nó. Ồ, và tôi cũng đã xem qua bản pdf này - nó đặc biệt đề cập đến "cụm" tai nạn máy bay (và mô tả vấn đề tốt hơn nhiều so với tôi cho đến nay ...).
Steve S

1
@Glen_b: Lỗ hổng trong bài báo (ngụ ý trong tiêu đề của bài viết, đó là tiêu đề của bài đăng của tôi) là bài báo cho thấy có xác suất cao hơn về một số lượng nhất định (ví dụ: một cụm) tai nạn xảy ra trong một khoảng thời gian ngắn hơn một khoảng thời gian dài hơn. Điều đó chỉ sai.
Joel W.

1
@JoelW.: Nếu có bất cứ điều gì, đó sẽ là nhà báo đã làm hỏng ... Dù sao, mọi thứ đã được giải tỏa hay bạn vẫn còn bất kỳ đặt phòng nào?
Steve S

1
Tôi đoán là chính nhà thống kê đã đánh lừa nhà báo. Tôi nghi ngờ nhà báo đã tự mình hiểu sai (vì nó quá phản trực giác).
Joel W.

Câu trả lời:


3

Tóm tắt: Câu đầu tiên trong đoạn trích dẫn của BBC là cẩu thả và sai lệch.

Mặc dù các câu trả lời và nhận xét trước đó đã cung cấp một cuộc thảo luận tuyệt vời, tôi cảm thấy rằng câu hỏi chính chưa được trả lời thỏa đáng.

Vì vậy, chúng ta hãy giả định rằng một xác suất của một tai nạn máy bay trên bất kỳ ngày nào là và rằng tai nạn là độc lập với nhau. Chúng ta hãy giả sử thêm rằng một chiếc máy bay đã bị rơi vào ngày 1 tháng 1. Khi nào máy bay tiếp theo gặp sự cố?p=1/365

Chà, chúng ta hãy thực hiện một mô phỏng đơn giản: mỗi ngày trong ba năm tới tôi sẽ quyết định ngẫu nhiên nếu một chiếc máy bay khác bị rơi với xác suất và lưu ý ngày xảy ra vụ tai nạn tiếp theo; Tôi sẽ lặp lại thủ tục này 100p lần. Đây là biểu đồ kết quả:100000

Phân phối máy bay nghiền, một mô hình

Trong thực tế, phân phối xác suất được đưa ra đơn giản bởi , trong đó t là số ngày. Tôi đã vẽ sơ đồ phân phối lý thuyết này như một đường màu đỏ và bạn có thể thấy rằng nó phù hợp với biểu đồ Monte Carlo. Lưu ý: nếu thời gian bị rời rạc trong các thùng nhỏ hơn và nhỏ hơn, phân phối này sẽ hội tụ theo cấp số nhân; nhưng nó không thực sự quan trọng cho cuộc thảo luận này.Pr(t)=(1p)tpt

Như nhiều người đã nhận xét ở đây, đó là một đường cong giảm dần . Điều này có nghĩa là xác suất máy bay tiếp theo gặp sự cố vào ngày hôm sau, ngày 2 tháng 1, cao hơn xác suất máy bay tiếp theo sẽ gặp sự cố vào bất kỳ ngày nào khác, ví dụ vào ngày 2 tháng 1 năm sau (chênh lệch gần gấp ba lần: 0,10 % ).0.27%0.10%

0.8%94% Đó là lý do tại sao ngay cả với phân phối xác suất giảm đơn điệu, chắc chắn rằng "cụm" (ví dụ hai vụ tai nạn máy bay trong ba ngày) rất khó xảy ra.

Đây là một biểu đồ khác để thực sự có được điểm này. Nó chỉ đơn giản là một tổng của biểu đồ trước đó trong một số khoảng thời gian không giao nhau:

Biểu đồ tần số nghiền phẳng


Bạn đang nói rằng giáo sư MIT là sai?
Steve S

1
Không, trích dẫn từ Barnett trong bài báo của BBC là hoàn toàn chính xác. Nhưng cách giải thích của phóng viên BBC là cẩu thả nhất: "Barnett cũng thu hút sự chú ý đến lý thuyết phân phối Poisson, ngụ ý rằng khoảng thời gian ngắn giữa các vụ tai nạn thực sự có thể xảy ra hơn so với thời gian dài" . Cách giải thích tự nhiên nhất của câu này là sai lầm (và tôi cho rằng Barnett không có ý ám chỉ điều đó). Có lẽ tôi nên rõ ràng hơn về điều đó trong câu trả lời của tôi. Có phần nào đáng kể trong câu trả lời của tôi mà bạn không đồng ý không? Hy vọng không, như tôi hoàn toàn đồng ý với bạn.
amip nói phục hồi Monica

13

Điều mà phóng viên đang nói là sự xuất hiện ngẫu nhiên của một vụ tai nạn máy bay có thể được mô hình hóa như một quá trình Poisson - một tình huống trong đó xác suất của một sự kiện xảy ra trong một khoảng (nhỏ) tỷ lệ thuận với độ dài của khoảng thời gian nói trên và mỗi lần xảy ra trong độc lập của tất cả những người khác.

Đây có phải là một mô hình hợp lý cho kịch bản được mô tả?

Có lẽ.

Chắc chắn, những sự kiện này có thể không độc lập 100% vì các phi công khác có thể thay đổi hành vi của họ (nếu chỉ rất nhẹ) sau một vụ tai nạn. [Tôi không biết - có lẽ một vài phi công thực hiện thêm một chút đào tạo giả lập hoặc đại loại như thế]. Tuy nhiên, giả định của Độc lập vẫn hoàn toàn hợp lý.

Thế còn cụm máy bay gặp sự cố?

Đúng. Đưa ra một quy trình Poisson (hoặc thậm chí một số quy trình ngẫu nhiên khác), bạn sẽ thấy một số cụm xuất hiện.

Trên thực tế, như được mô tả bởi Từ điển thống kê Oxford trong mục nhập cho Quá trình Poisson (là một "mô tả toán học về tính ngẫu nhiên"):

[R]andomness usually gives rise to apparent clustering, despite the natural
expectation that randomness would lead to regularity.

Ví dụ, kiểm tra bit mã R đơn giản này :

set.seed(123)
x <- runif(500)
y <- runif(500)

plot(x, y, pch=20, col='blue', main="A Random Distribution of Points")

sản xuất:
Chú ý vón cục?

Mặc dù chúng tôi biết đây là một âm mưu của các điểm ngẫu nhiên, nó loại trông giống như có một số phi bit -random với nó - đặc biệt, trong một số bộ phận của đồ thị có khối điểm trong khi các bộ phận khác đang rộng mở. Đây là loại hành vi tương tự mà bài viết đang cố gắng mô tả (chỉ với dữ liệu chuỗi thời gian và không phải dữ liệu không gian ).


CẬP NHẬT:

@JoelW.: Vì vậy, ví dụ, giả sử xác suất máy bay rơi vào ngày mai (hoặc bất kỳ ngày nào trong vấn đề đó) là " p " (và, giả sử " p " là khoảng 1 phần trăm).

Lý do tại sao vụ tai nạn máy bay tiếp theo có nhiều khả năng xảy ra vào ngày mai hơn là có khả năng xảy ra trong đúng một năm (tức là vào ngày 26 tháng 7 năm 2015 ) là vì xác suất xảy ra vụ tai nạn tiếp theo trong đúng một năm là bằng:

= Prob(crash tomorrow) * Prob(365 days with *no* crashes)

Có lý?

Cuối cùng, tôi nghĩ rằng lý do những điều này là Phản trực giác là bởi vì thông thường khi chúng ta nghĩ về một cụm từ như : "The odds of a plane crash in one month compared with the odds of one happening tomorrow". Chúng tôi tự nhiên không ngay lập tức xem xét khoảng thời gian 24 giờ bắt đầu trong đúng một tháng. Thay vào đó, chúng tôi (hoặc ít nhất là tôi làm) có xu hướng nghĩ về nó nhiều hơn, tốt, linh hoạt . Vì vậy, nhiều hơn như : a month ± a week. Điều đó và thực tế là chúng ta quên mất việc tính đến tỷ lệ của một vụ tai nạn không xảy ra trong thời gian tạm thời ... (Nhưng một lần nữa, có lẽ đó chỉ là tôi ...).

Phù!


Tài nguyên bổ sung:

  • Bài viết của Wikipedia về ảo ảnh cụm
  • Một bản pdf có đề cập cụ thể đến việc "phân cụm" các sự cố máy bay (trên trang 8) và mô tả ngắn gọn về toán học của một quá trình Poisson .

1
@Joel W.: Thật ra, tôi nên thêm nhiều hơn vào câu trả lời này - hãy cho tôi vài phút để chỉnh sửa ...
Steve S

7
Lập luận cho việc trì hoãn việc đi lại là cùng một câu chuyện xuất hiện trong trò đùa cũ về cách TSA tìm thấy một nhà thống kê với một quả bom trên máy bay. Khi được yêu cầu tự giải thích, nhà thống kê nói: "Chà, tỷ lệ một người có bom là nhỏ nhưng không đủ nhỏ để thoải mái, nhưng tỷ lệ hai người có bom là vô cùng lớn. Vì vậy, khi tôi mang bom, có gần như không có cơ hội sẽ có hai quả bom và chúng tôi sẽ hoàn toàn an toàn. "
whuber

1
Trò đùa của bạn là đúng, @whuber, nhưng dường như có một sự ngắt kết nối logic nào đó giữa việc nói rằng "khoảng thời gian ngắn giữa các sự cố thực sự có thể xảy ra hơn so với thời gian dài" và nói rằng xác suất xảy ra sự cố vào ngày mai không phụ thuộc vào việc có sự cố hay không xảy ra hôm nay Tôi đoán xác suất có thể phản trực giác.
Joel W.

1
Điều trực quan (đối với tôi) đang nói rằng các sự kiện hiếm có xu hướng xảy ra gần đúng lúc. Theo trực giác, tôi sẽ nghĩ rằng các sự kiện hiếm hoi sẽ không xảy ra gần đúng lúc. Tôi có phải là người duy nhất có cái nhìn trực quan đó không?
Joel W.

1
@Steve S: Cảm ơn bạn đã liên kết. Phân phối theo cấp số nhân sẽ trông như thế nào đối với giá trị giả định trong bài báo (1/365)? Trong mọi trường hợp, có lẽ Phân phối theo cấp số nhân không đề cập đến tiêu đề của bài viết, trong đó ngụ ý so sánh xác suất của một số sự kiện đã cho xảy ra trong một khoảng thời gian ngắn với xác suất của số sự kiện đó xảy ra trong một khoảng thời gian dài .
Joel W.

4

Nếu số vụ tai nạn máy bay được phân phối Poisson (dường như anh ta nói rõ), thời gian giữa các vụ tai nạn có phân phối theo cấp số nhân. Pdf của phân bố mũ là hàm giảm thời gian đơn điệu. Do đó các sự cố trước đó có nhiều khả năng hơn các sự cố sau này.


"Khoảng thời gian ngắn giữa các vụ tai nạn thực sự có nhiều khả năng xảy ra hơn thời gian dài" Điều này khác với việc nói rằng nếu vừa xảy ra tai nạn máy bay, tất cả chúng ta nên trì hoãn chuyến đi sắp tới (vì lý do thống kê)?
Joel W.

2
Joel, trích dẫn đó là vô nghĩa cho đến khi tác giả của nó định lượng những gì có nghĩa là "ngắn" và "dài". Trong ví dụ của ông về một sự kiện với tỷ lệ dự kiến ​​là một năm, khả năng tái phát trong tháng tới sẽ vẫn ít hơn nhiều so với khả năng vụ tai nạn tiếp theo xảy ra hơn một năm sau đó. Những gì anh ta có thể có nghĩa là xác suất trên mỗi đơn vị thời gian là lớn hơn trong thời gian gần hơn trong dài hạn. Để so sánh xác suất thực tế, bạn phải nhân xác suất trên mỗi đơn vị thời gian với thời lượng (về mặt kỹ thuật, bạn phải tích hợp nó theo thời lượng).
whuber

@whuber: Dòng tiêu đề nói về khả năng xảy ra tai nạn máy bay. Không có gì nói trên stackexchange cho đến nay đã thuyết phục tôi rằng một loạt các vụ tai nạn máy bay là phổ biến hơn hoặc có khả năng hơn là tai nạn máy bay khoảng cách rộng rãi. Vì vậy, dường như với tôi rằng trích dẫn từ các phương tiện truyền thông là hoàn toàn sai lệch (có lẽ vì khoảng thời gian không được xác định, như bạn đã viết). Bạn nghĩ sao?
Joel W.

Tôi không biết ý của bạn là gì khi "tai nạn máy bay cách xa" cũng như, đối với vấn đề đó, tôi hoàn toàn chắc chắn bạn hiểu "cụm" là gì. Giả sử, để làm cho tình huống cụ thể, một loạt các sự kiện hiếm xảy ra trong các năm 0, 10, 11, 12 và 22 (tính từ một số ngày ban đầu). Chính xác có bao nhiêu sự kiện "khoảng cách rộng rãi" đã xảy ra? Có bao nhiêu "cụm" đã xảy ra? Tôi có thể tìm thấy câu trả lời có thể phòng thủ cho câu hỏi đầu tiên từ 0 đến 10 và câu trả lời cho câu hỏi thứ hai có thể bằng 0 hoặc một.
whuber

1
@whuber: Dòng tiêu đề ngụ ý rằng nó có nhiều khả năng xảy ra các vụ tai nạn hơn là các vụ tai nạn xảy ra rộng rãi. Hãy vận hành nó. Giả sử một cụm là 3 tai nạn máy bay và một khoảng thời gian ngắn là 3 tháng và một khoảng thời gian dài là 3 năm. Có vẻ phi logic khi nghĩ rằng có khả năng cao hơn là 3 vụ tai nạn sẽ xảy ra trong khoảng thời gian 3 tháng so với trong khoảng thời gian 3 năm. Ngay cả khi chúng tôi nhận tai nạn đầu tiên như một sự cho trước, thật phi lý khi nghĩ rằng sẽ có thêm 2 vụ tai nạn xảy ra trong vòng 3 tháng tới so với trong vòng 3 năm tới.
Joel W.

0

Các câu trả lời khác đã xử lý như thế nào cụm sự kiện độc lập . (Đọc Chaos của Gleick, tất cả những năm trước, đã mở mắt cho ý tưởng này.)

Nhưng, trên thực tế có bằng chứng mạnh mẽ cho thấy tai nạn máy bay không phải là sự kiện độc lập. Ảnh hưởng của Cialdini có một chương rất hay về điều này (cũng được đề cập ở đây có một vài liên kết đến dữ liệu; và tôi đã tìm thấy một đoạn trích của phần đó của cuốn sách ). Rõ ràng điều này rất gây tranh cãi: về cơ bản người ta nói rằng một vụ tai nạn hàng không càng công khai thì càng có khả năng ảnh hưởng đến một phi công (có ý thức hoặc vô thức) để rơi máy bay của anh ta. Nhưng những giải thích tâm lý làm cơ sở cho giả thuyết này có vẻ hợp lý và dữ liệu dường như cũng ủng hộ nó.

(Liên kết đến nghiên cứu gỡ lỗi dựa trên thống kê sẽ được hoan nghênh, trong các bình luận.)


Không nói rằng: "ngay lập tức sau một số loại câu chuyện tự tử được công bố rộng rãi, số người chết trong các vụ tai nạn hàng không thương mại tăng lên".
Scortchi - Tái lập Monica

Tài liệu tham khảo cho tuyên bố này, theo tôi, Phillips, (1978) "Tử vong do tai nạn máy bay gia tăng ngay sau những câu chuyện trên báo về giết người và tự sát", Science , 201 , tr 748-750. Bản tóm tắt đề cập đến "máy bay tư nhân, kinh doanh và điều hành doanh nghiệp".
Scortchi - Tái lập Monica

Hoặc có lẽ là cái này: Phillips (1980), "Tai nạn máy bay, giết người và các phương tiện thông tin đại chúng: hướng tới một lý thuyết bắt chước và gợi ý", Lực lượng xã hội , 58 , 4, trong đó "các hãng hàng không" được đề cập trong bản tóm tắt.
Scortchi - Tái lập Monica

2
Altheide (1981), Lực lượng xã hội , 60 , 2 cho rằng một "câu chuyện tự tử công khai nhất định" có thể không được định nghĩa hoàn toàn độc lập với các vụ tai nạn máy bay tiếp theo - nghe giống như định nghĩa của "giáo sĩ nổi tiếng" .
Scortchi - Tái lập Monica
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.