Câu trả lời thực sự cho câu hỏi sinh nhật là gì?


13

"Một lớp học phải lớn đến mức nào để xác suất tìm thấy hai người có cùng ngày sinh ít nhất 50%?"

Tôi có 360 bạn bè trên facebook và, như mong đợi, việc phân phối ngày sinh nhật của họ không thống nhất chút nào. Tôi có một ngày với 9 người bạn cùng ngày sinh nhật. (9 tháng sau ngày lễ lớn và ngày lễ tình nhân dường như là ngày trọng đại, lol ..) Vì vậy, cho rằng một số ngày có nhiều khả năng cho ngày sinh nhật, tôi cho rằng số 23 là số cao.

Đã có một ước tính tốt hơn cho vấn đề này?


3
Một mẫu 360 người không tạo ra một mẫu lớn để phân phối ngày sinh trong hơn 365 ngày trong năm ... Bạn chắc chắn không thể kiểm tra tính đồng nhất trên một mẫu nhỏ như vậy.
Tây An

Một người có ngày sinh nhật, tỷ lệ cược mà người thứ hai không chia sẻ cùng ngày sinh là bao nhiêu? 364/365, tỷ lệ cược mà người thứ ba không chia sẻ ngày sinh là gì? (364/365) * (363/365). Mở rộng về điều này cho đến khi bạn có một xác suất < 50%. Điều đó có nghĩa là tỷ lệ cược không ai có cùng ngày sinh, điều đó có nghĩa là tỷ lệ cược cho ít nhất hai người chia sẻ một ngày sinh nhật sẽ là > 50%.
zzzzBov

8
Có phải chúng ta cho rằng bạn có bạn bè ngẫu nhiên ?
James

1
@zzzzBov - bạn không hiểu OP đang yêu cầu gì. Đây là cách tiếp cận mà chúng tôi cho rằng mỗi sinh nhật đều có khả năng như nhau, mỗi cơ hội có là của bạn. OP đang hỏi về ước tính sẽ như thế nào khi nói sinh vào ngày 1 tháng 1 không giống như sinh vào ngày 15 tháng 21365
xác suất

Câu trả lời:


18

May mắn thay, ai đó đã đăng một số dữ liệu sinh nhật chính hãng với một chút thảo luận về một câu hỏi liên quan (là đồng phục phân phối). Chúng tôi có thể sử dụng điều này và lấy mẫu lại để chỉ ra rằng câu trả lời cho câu hỏi của bạn rõ ràng là 23 - giống như câu trả lời lý thuyết .

> x <- read.table("bdata.txt", header=T)
> birthday <- data.frame(date=as.factor(x$date), count=x$count)
> summary(birthday) 
      date         count     
 101    :  1   Min.   : 325  
 102    :  1   1st Qu.:1266  
 103    :  1   Median :1310  
 104    :  1   Mean   :1314  
 105    :  1   3rd Qu.:1362  
 106    :  1   Max.   :1559  
 (Other):360                 
> results <- rep(0,50)
> reps <-2000 # big number needed as there is some instability otherwise
> for (i in 1:50)
+ {
+ count <- 0
+ for (j in 1:reps)
+ {
+ samp <- sample(birthday$date, i, replace=T, prob=birthday$count)
+ count <- count + 1*(max(table(samp))>1)
+ }
+ results[i] <- count/reps
+ }
> results
 [1] 0.0000 0.0045 0.0095 0.0220 0.0210 0.0395 0.0570 0.0835 0.0890 0.1165
[11] 0.1480 0.1770 0.1955 0.2265 0.2490 0.2735 0.3105 0.3350 0.3910 0.4165
[21] 0.4690 0.4560 0.5210 0.5310 0.5745 0.5975 0.6240 0.6430 0.6950 0.7015
[31] 0.7285 0.7510 0.7690 0.8025 0.8225 0.8280 0.8525 0.8645 0.8685 0.8830
[41] 0.8965 0.9020 0.9240 0.9435 0.9350 0.9465 0.9545 0.9655 0.9600 0.9665

8
Thật vậy, người ta có thể chỉ ra thông qua lồi Schur , rằng đối với bất kỳ phân phối không sinh nhật nào, xác suất của trận đấu ít nhất là lớn như trong trường hợp thống nhất. Đây là Bài tập 13.7 của J. Michael Steele, Lớp thạc sĩ Cauchy-Schwarz: Giới thiệu về nghệ thuật bất bình đẳng toán học , Nhà xuất bản Đại học Cambridge, 2004, trg. 206 .
Đức hồng y

2
@ Tây An: Thật vậy. Bây giờ, nếu tôi biết ai đó đã đánh giá sách cho một tạp chí thống kê độc giả cao, chất lượng cao, tôi khuyên họ nên xem lại để cung cấp khả năng hiển thị cao hơn cho các nhà thống kê ... nhưng tìm đâu ra một người như vậy ...
Đức hồng y

3
(Đối với những người có thể thắc mắc về nhận xét ngay trước mắt của tôi, nó đề cập đến thực tế rằng @ Xi'an là nhà phê bình sách mới được bổ nhiệm cho Cơ hội .)
Hồng y

2
@ Tây An, hãy kiểm tra điều này và xem những gì bạn nghĩ : table(replicate(10^5, max(tabulate(sample(1:365,360,rep=TRUE))))).
whuber

3
Có lẽ không rõ ràng, ngoại trừ R cognoscenti, mã trong các nhận xét trước đây của @ Xi'an và bản thân tôi mô phỏng tình huống của OP. Chạy nó cho thấy cơ hội 9 người trở lên chia sẻ ngày sinh nhật, trong số 360 người được chọn ngẫu nhiên từ một dân số phân bố đồng đều, chỉ khoảng 40 trên 100.000. Giá trị khả dĩ nhất cho số ngày sinh nhật được chia sẻ tối đa là 5.
whuber
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.