Đảo ngược vấn đề sinh nhật với nhiều va chạm


9

Giả sử bạn đã có một năm người ngoài hành tinh với độ dài không xác định. Nếu bạn có một mẫu người ngoài hành tinh nói ngẫu nhiên và một số người trong số họ chia sẻ ngày sinh nhật, bạn có thể sử dụng dữ liệu này để ước tính độ dài của năm không?

Ví dụ, trong một mẫu 100, bạn có thể có hai bộ ba (tức là hai ngày sinh được chia cho ba người ngoài hành tinh) và năm cặp và tám mươi bốn singletons. Khi ước tính N, mức tối thiểu tuyệt đối là 91 và mức tối đa là không giới hạn, nhưng làm thế nào tôi tìm được giá trị kỳ vọng hợp lý?

Giả định bao gồm những thứ như "tất cả các sinh nhật đều có khả năng như nhau".

Không giống như một câu hỏi khác được trả lời ở đây, có những va chạm được biết đến trong phòng. Bất kỳ năm nào đủ dài sẽ có khả năng mạnh mẽ không có va chạm cho một căn phòng của người ngoài hành tinh. Nhưng những năm rất dài sẽ có tỷ lệ thấp của bất kỳ va chạm nào và những năm ngắn sẽ có tỷ lệ thấp của một vài va chạm, do đó cung cấp một phạm vi (lý thuyết) cho độ dài năm rất có thể.


3
Câu trả lời của tôi cho một phiên bản đặc biệt của câu hỏi này dễ dàng khái quát hóa (sử dụng phân phối đa phương thức): xem stats.stackexchange.com/questions/252813 .
whuber

@Techhead Theo nhiều cách khác nhau! Cách tiếp cận rõ ràng để ước tính tham số cần đề cập sẽ là khả năng tối đa.
Glen_b -Reinstate Monica


1
@whuber Tôi thấy câu hỏi đó và nhận xét của bạn, nhưng tôi không thấy cách áp dụng hầu hết câu hỏi cho một mẫu có va chạm đã biết. Không khó để tìm thấy hình thức mở rộng, nhưng tôi không biết làm thế nào tôi có thể tìm thấy tổng logarit.
Techhead

1
Tôi đồng ý rằng phiên bản của bạn đủ phức tạp hơn để không bị đóng dưới dạng bản sao.
whuber

Câu trả lời:


2

Giá trị kỳ vọng của phân phối được tính là . Đối với vấn đề này, chúng tôi muốn tính toán phân phối của với một số tiêu chí va chạm hoặc tìm đưa ra một số tiêu chí va chạm, trong đó N E ( N ) = n = 0 p n n p n = P ( N = n ) .E(X)=pixiNE(N)=n=0pnnpn=P(N=n).

Giả sử bạn có một số tiêu chí va chạm như đã nêu ở trên và đặt là xác suất để các tiêu chí va chạm được đáp ứng với độ dài của năm làSau đó, có thể được tìm thấy bằng cách chia số cách các tiêu chí va chạm có thể được đáp ứng theo số cách có thể sắp xếp ngày sinh nhật nói chung. Khi được tìm thấy cho mỗi có thể , thì phần duy nhất còn thiếu là dịch sang n . q n q n n q n p n .qnn.qnqnnqnpn.

Nếu chúng ta giả sử rằng tỷ lệ thuận với , thìVì , vàDo đó, chúng ta chỉ cần một công thức cho để giải quyết vấn đề này.q n p n = α q n . n = 0 p n = 1 α n = 0 q n = 1 α = 1pnqnpn=αqn.n=0pn=1αn=0qn=1qnα=1n=0qn.qn

Ví dụ của bạn, trước tiên chúng ta hãy tìm số cách các tiêu chí va chạm có thể xảy ra vớiNgười ngoài hành tinh đầu tiên có thể hạ cánh bất cứ ngày nào, vì vậy có khả năng. Người độc thân tiếp theo có thể hạ cánh vào bất kỳ ngày nào trừ ngày sinh nhật của người ngoài hành tinh đầu tiên, vì vậy có khả năng . Hoàn thành điều này cho 84 singletons đầu tiên, chúng ta có những cách có thể xảy ra. Lưu ý rằng chúng tôi cũng có 5 cặp và 2 bộ ba, vì vậy người ngoài hành tinh "đầu tiên" cho mỗi nhóm cũng không được đặt trên các cặp đơn. Điều này dẫn đến một theo cách mà những người ngoài hành tinh này không va chạm (cú pháp vụng về là để khái quát hóa dễ dàng hơn sau này).n n - 1 n ( n - 1 ) ( n - 2 ) . . . ( n - 83 ) n ( n - 1 ) ( n - 2 ) . . . ( n - 84 - 5 - 2 + 1 )N=n.nn1n(n1)(n2)...(n83)n(n1)(n2)...(n8452+1)

Tiếp theo, người ngoài hành tinh thứ hai cho một cặp hoặc bộ ba nhất định có 91 lựa chọn, tiếp theo có 90, v.v., tổng số cách có thể xảy ra trong ngày sinh của 91 người ngoài hành tinh đầu tiên là . Các thành viên còn lại của bộ ba phải rơi vào ngày sinh nhật của các cặp và xác suất xảy ra là . Chúng tôi nhân các xác suất cho tất cả những điều này với nhau để có được tổng số cách có thể để các tiêu chí va chạm được đáp ứng là:7 * 691(911)(912)...(917+1)76

rn=n(n1)...(n8452+1)(84+5+2)(84+5+21)...(84+1)(5+2)(5+1)

Tại thời điểm này, các mô hình là rõ ràng, nếu chúng ta có độc thân, cặp, và ba, chúng ta thay thế 84 với 5 với và 2 với để có được một công thức tổng quát. Tôi nghĩ cũng rõ ràng rằng số cách có thể để sắp xếp ngày sinh nhật nói chung là , trong đó m là tổng số người ngoài hành tinh trong vấn đề. Do đó, xác suất đáp ứng các tiêu chí va chạm là số cách đáp ứng các tiêu chí va chạm chia cho số cách người ngoài hành tinh có thể được sinh ra, hoặc .b c a , b , c n m q n = r nabca,b,cnmqn=rnnm

Một điều thú vị khác xuất hiện trong công thức của . Đặt Và để là phần còn lại của sao cho . Lưu ý rằng độc lập với n, vì vậy chúng ta chỉ cần viết là hằng số! Vì và , nên chúng tôi thực sự có thể tính ra khỏi tổng trong mẫu số. Tại thời điểm này, nó hủy bỏ phần từ tử số để lấy . Chúng ta có thể đơn giản hóay n = n ( n - 1 ) . . . ( n - ( a + b + c ) + 1 ) = n !rnyn=n(n1)...(n(a+b+c)+1)=n!(n(a+b+c))!r n r n = y n z n z n z n = z p n = q n / i = 0 q i q n = z y nznrnrn=ynznznzn=zpn=qn/i=0qi zpn=ynqn=zynnmzyns=a+b+cpn=ynnm/i=0(yiim)ynhơn nữa nếu chúng ta để (hoặc điều này có thể được coi là số ngày sinh duy nhất trong nhóm người ngoài hành tinh), để chúng ta có được:s=a+b+c

pn=n!(ns)!nm/i=0(i!(is)!im)

Bây giờ chúng ta có một công thức đơn giản (khá) cho , và do đó, một công thức đơn giản (khá) cho , trong đó giả định duy nhất được đưa ra là tỷ lệ thuận với (xác suất gặp va chạm tiêu chí cho rằng ). Tôi nghĩ rằng đây là một giả định hợp lý để thực hiện và ai đó thông minh hơn tôi thậm chí có thể chứng minh rằng giả định này có liên quan đến sau phân phối đa phương thức. Tại thời điểm này, chúng ta có thể tính toán bằng các phương pháp số hoặc đưa ra một số giả định gần đúng, vì sẽ tiếp cận 0 khi tiếp cận . E ( N ) P ( N = n ) q n N = n P ( N = n ) E ( N ) p n npnE(N)P(N=n)qnN=nP(N=n)E(N)pnn


Có vẻ như bạn đề xuất tính giá trị kỳ vọng dựa trên hàm khả năng thay vì hàm khối lượng xác suất. Đó có phải là cố ý?
Sextus Empiricus

2

Câu trả lời tuyệt vời từ Cody cung cấp một cách tốt đẹp để diễn tả hàm likelihood cho , những ngày số trong năm (hoặc phân bố sau dựa trên một trước phẳng) bằng cách thanh toán ra một số phần của xác suất mà là độc lập với .NN

Trong câu trả lời này, tôi muốn viết nó chính xác hơn và cũng cung cấp một cách để tính toán tối đa của hàm khả năng này (chứ không phải là giá trị mong đợi khó tính toán hơn nhiều).


Hàm khả năng cho N

Số cách để vẽ một chuỗi ngày sinh trong số ngày sinh, với hạn chế là là số ngày sinh đơn, sinh nhật trùng lặp và sinh ba lần bằnga+2b+3cnabc

rn=(na+b+c)number of ways topick m unique birthdaysout of n days(a+b+c)!a!b!c!number of ways todistribute m birthdaysamong groups of size ab and c(a+2b+3c)!1!a2!b3!cnumber of ordered ways toarrange specific single, duplicate, and triplicatesamong the aliens =n!(nabc)!×(a+2b+3c)a!b!c!1!a2!b3!c

và chỉ thuật ngữ đầu tiên trên righthandside phụ thuộc vào , do đó, bằng cách tìm ra các thuật ngữ khác, chúng tôi kết thúc bằng một biểu thức đơn giản cho hàm khả năngn

L(n|a,b,c)=n(a+2b+3c)n!(nabc)!=nmn!(ns)!P(a,b,c|n)

nơi chúng tôi làm theo các ký hiệu từ Cody và sử dụng để biểu thị số lượng người ngoài hành tinh và số lượng sinh nhật độc đáo.ms


Ước tính khả năng tối đa cho N

Chúng ta có thể sử dụng chức năng này khả năng để lấy được các ước lượng tối đa cho .N

Lưu ý rằng

L(n)=L(n1)(n1n)mnns

và tối đa sẽ xảy ra ngay trước khi màn

(n1n)mnns=1

hoặc là

s=n(1(11/n)m)

đó là cho lớn (sử dụng chuỗi Laurent mà bạn có thể tìm thấy bằng cách thay thế và viết chuỗi Taylor cho theo điểm )nx=1/nxx=0

sk=0l(mk)(n)k+O(n(l+1))

Chỉ sử dụng thuật ngữ đơn hàng đầu tiên bạn nhận được:smm(m1)2n

n1(m2)ms

Sử dụng thuật ngữ thứ tự thứ hai cũng bạn nhận được :smm(m1)2n+m(m1)(m2)6n2

n2(m2)+(m2)24(ms)(m3)2(ms)

Vì vậy, trong trường hợp người ngoài hành tinh trong đó có ngày sinh duy nhất bạn có được bằng cách sử dụng xấp xỉ và . Khi bạn giải phương trình số, bạn nhận được mà chúng ta làm tròn xuống để lấy MLE.m=100s=91n1550n2515.1215n=516.82n=516

so sánh xấp xỉ với MLE thật

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.