EDIT: Tôi quan tâm nhiều hơn đến các vấn đề kỹ thuật và phương pháp xác định khả năng tối đa "thực sự" trong một dân số nhất định được đưa ra một thống kê mẫu. Có những vấn đề với việc ước tính khả năng chạy nhanh hơn ông Bolt từ thời gian lập kỷ lục thiết lập kỷ lục vừa rõ ràng vừa tinh tế. Hài hước cho tôi bằng cách tưởng tượng điều này không phải là trường hợp.
Usain Bolt là người nhanh nhất được đo cho cú nhảy 100m. Tuy nhiên, với số lượng vận động viên ít ỏi, có vẻ như con người "thực sự" nhanh nhất còn sống đang ngồi trên một chiếc ghế dài ở đâu đó và chưa bao giờ thử sức với một sự nghiệp thi đấu.
Tôi đang cố gắng sử dụng thực tế là sự khác biệt giữa các mẫu ở đuôi phân phối bình thường trở nên nhỏ hơn và nhỏ hơn. Tôi đang sử dụng điều này để tính toán khả năng tồn tại một người nào đó nhanh hơn Usain Bolt bằng cách so sánh Usain với người nhanh thứ 2, nhanh thứ 3, v.v.
Để làm điều này, tôi đang cố gắng tính giá trị lớn nhất tồn tại ngoài "Usain Bolt" bằng cách lấy đạo hàm của CDF phân phối bình thường đối với , nâng giá trị đó lên thứ n (trong đó n là khoảng 7.000.000.000 hoặc số các mẫu nhỏ hơn "tối đa" - logic đằng sau điều này được mô tả trong Bài toán xe tăng Đức trang Wikipedia về , khái quát giữa các bản phân phối khác nhau), ví dụ:
Đây có phải là cách hợp lệ để tính xác suất tồn tại ai đó nhanh hơn Usain Bolt không?
Có một tên cho loại câu hỏi này ngoài "Vấn đề xe tăng Đức cho các bản phân phối khác"
Có cách nào tốt để ước tính độ lệch chuẩn so với các mẫu cực của phân phối không? Tìm kiếm thông tin về dấu gạch ngang 100m nhanh nhất mọi thời đại thật dễ dàng, tìm trung bình & phương sai rất khó)
Cảm ơn bạn đã kiên nhẫn của bạn trong việc làm việc với một lập trình viên mà không có nền tảng trong chủ đề.