Lý lịch
Tôi đang nghiên cứu những sự trùng hợp phổ biến và những sự trùng hợp "gần" mà tuy nhiên (quá mức) gây ấn tượng với người bình thường. Câu hỏi dưới đây là phần mở rộng của vấn đề Sinh nhật nổi tiếng , câu hỏi "Cần bao nhiêu người, được chọn ngẫu nhiên, để có 50% cơ hội hai người trong số họ chia sẻ cùng một ngày sinh nhật?" Câu trả lời là . (Nó thực sự thấp hơn một chút nếu người ta kết hợp thực tế là ngày sinh nhật không được phân phối đồng đều trong suốt cả năm, mà thay vào đó là "co cụm" trong một số tháng nhất định, do đó làm tăng xác suất hai người chia sẻ cùng một ngày sinh nhật.) Nếu một người thư giãn điều kiện và cho phép sự trùng hợp "gần" của cùng một ngày sinh nhật hoặc khác nhau một ngày , câu trả lời giảm xuống chỉ còn ,
Dưới đây là phần mở rộng của vấn đề sinh nhật, nhưng thú vị và phức tạp hơn.
Có bao nhiêu người Mỹ, được chọn ngẫu nhiên, cần có 50% cơ hội hai người họ sống ở a) cùng một tiểu bang hoặc b) trong cùng một tiểu bang hoặc một tiểu bang lân cận?
Giả sử chúng tôi được cung cấp một danh sách 50 tiểu bang với dân số của họ:
cũng như một ma trận kề kề (hoặc đồ thị vô hướng ) chứa thông tin phụ thuộc trạng thái (bao gồm cả tự điều chỉnh), nghĩa là chia sẻ đường viền:
.
Lưu ý rằng chúng tôi muốn giải quyết vấn đề này bằng cách tính toán với xác suất có điều kiện và không cần dùng đến mô phỏng ngẫu nhiên. Một cách tiếp cận nghiêm ngặt như vậy là nguyên tắc và khái quát hóa một cách tự nhiên hơn cho các vấn đề rất lớn.
Cách tiếp cận với a) sẽ là một khái quát về vấn đề Sinh nhật, nhưng câu trả lời cho b) có vẻ phức tạp hơn một chút.
Tôi đang tìm kiếm các phương trình (và giải thích). Sau đó tôi có thể tính toán các giá trị số bằng cách sử dụng dữ liệu điều tra dân số và địa lý.
Tôi sẽ lưu ý ở đây rằng thông qua tìm kiếm ngẫu nhiên, câu trả lời cho b) là một (có lẽ đáng ngạc nhiên) chỉ có 3,5 người. Với 4 người, cơ hội gần 60% ít nhất hai người đến từ cùng một quốc gia hoặc các quốc gia lân cận.