Có phân phối xác suất của một chiếc bình thay đổi khi bạn rút ra từ nó mà không thay thế trung bình không?


9

Giả sử tôi có một chiếc bình chứa N màu sắc khác nhau của mỗi quả bóng và mỗi màu khác nhau có thể xuất hiện một số lần khác nhau (nếu có 10 quả bóng màu đỏ thì không cần phải có 10 quả bóng màu xanh). Nếu chúng ta biết chính xác nội dung của chiếc bình trước khi vẽ, chúng ta có thể tạo thành một phân phối xác suất riêng biệt cho chúng ta biết xác suất vẽ từng màu của quả bóng. Điều tôi băn khoăn là cách phân phối thay đổi sau khi vẽ k bóng mà không thay thế từ bình trung bình. Tôi hiểu rằng khi chúng ta rút ra từ chiếc bình, chúng ta có thể cập nhật phân phối với kiến ​​thức về những gì đã bị loại bỏ, nhưng điều tôi muốn biết là chúng ta sẽ mong đợi hình dạng của phân phối là gì sau khi chúng ta loại bỏ k bóng. Là phân phối thay đổi trung bình hoặc nó vẫn giữ nguyên? Nếu nó không còn như cũ, chúng ta có thể viết ra một số công thức cho những gì chúng ta mong đợi phân phối mới trông giống như trung bình sau khi thực hiện rút thăm k không?


1
tôi có thể sai - nhưng cảm giác như người ta biết phân phối trước, nhưng không có thông tin về khả năng (bên cạnh đó k bóng bị loại bỏ). trong trường hợp đó - tôi sẽ cho rằng hậu thế bằng với trước. Công bằng mà nói - có khả năng thông tin rằng số lượng bóng đã giảm và (đối với một quả bóng bị loại bỏ), do đó, phân phối là lưỡng tính giữa 50% khả năng của 9 đỏ và 10 đen và 50% sở hữu của 10 đỏ và 9 đen . Tôi đã sai ở đây mặc dù
Wouter

Trực giác của tôi là nó giống như trường hợp sau mà bạn mô tả. Tôi không thể tìm thấy bất cứ ai nói về loại quá trình này mặc dù.
mjnichol

Câu trả lời:


7
  1. "Tính toán trực tiếp": Cho phép có quả bóng màu trong bình. Chúng ta hãy tập trung vào xác suất vẽ một màu cụ thể, giả sử màu trắng , trong lần vẽ thứ hai. Đặt số lượng bóng trắng là . Đặt là màu của quả bóng thu được ở lần rút thứ .nmnwXii

    P(X2=W)=P(X2=W|X1=W)P(X1=W)+P(X2=W|X1=W¯)P(X1=W¯)=nw1n1nwn+nwn1nnwn=nw(nnw+nw1)n(n1)=nwn=P(X1=W)

    Tất nhiên, lập luận tương tự này áp dụng cho bất kỳ màu nào trong lần rút thứ hai. Chúng ta có thể áp dụng cùng một loại đối số đệ quy khi xem xét các lần rút sau.

    [Tất nhiên người ta có thể thực hiện một phép tính trực tiếp hơn nữa. Xem xét đầu tiên thu hút như bao gồm bóng trắng và bóng không phải da trắng (với xác suất do sự phân bố hypergeometric), và thực hiện các tính toán tương ứng với một đơn giản trên nhưng cho bốc thăm ở bước ; người ta nhận được một sự đơn giản hóa và hủy bỏ tương tự, nhưng nó không thực sự khai sáng.]kikik+1

  2. Một đối số ngắn hơn: xem xét ghi nhãn ngẫu nhiên các quả bóng với các số , và sau đó rút chúng ra theo thứ tự được dán nhãn. Câu hỏi bây giờ trở thành "Xác suất mà một nhãn nhất định, , được đặt trên một quả bóng trắng giống như xác suất mà nhãn được đặt trên một quả bóng trắng?"1,2,...,nk1

    Bây giờ chúng ta thấy câu trả lời phải là "có" bằng tính đối xứng của các nhãn. Tương tự, bằng cách đối xứng các màu bóng, chúng ta không nói "trắng", do đó, đối số mà nhãn và nhãn có cùng xác suất áp dụng cho bất kỳ màu nào. Do đó, phân phối ở lần rút thứ giống như lần rút đầu tiên, miễn là chúng tôi không có thêm thông tin nào từ lần rút trước đó (miễn là không thấy bóng rút ra trước đó).k1k


Liên quan chặt chẽ đến cách thứ 2 của bạn, là một lập luận ngắn khác: hãy tưởng tượng tập hợp tất cả các chuỗi có thể trong đó các quả bóng có thể được loại bỏ (ví dụ: màu xanh trước, sau đó là trắng, sau đó là trắng, ... có thể là một chuỗi như vậy). Nếu với mỗi chuỗi trong tập hợp này, chúng ta trao đổi các phần tử và , chúng ta chỉ cần hoán vị tập hợp. Vì vậy, với mỗi chuỗi có bóng trắng (hoặc bất cứ thứ gì) ở vị trí , có chính xác một chuỗi tương ứng với bóng trắng ở vị trí . Do đó xác suất của một quả bóng trắng ở vị trí hoặc vị trí phải giống nhau. Tôi nghĩ rằng đây thực chất là lập luận của Neil. k t h k 1 k 11stkthk1k1
Cá bạc

@Silverfish Vâng, nhìn vào nó, đối số thứ hai của tôi về cơ bản là cùng loại đối số như đối số hoán vị của Neil.
Glen_b -Reinstate Monica

Cảm ơn đã giải thích. Đó chính xác là những gì tôi cần để xem!
mjnichol 16/07/2015

6

Lý do duy nhất không rõ ràng là phân phối vẫn không thay đổi (với điều kiện ít nhất một quả bóng vẫn còn) là có quá nhiều thông tin. Hãy loại bỏ các tài liệu gây mất tập trung.

Bỏ qua, trong một khoảnh khắc, màu sắc của mỗi quả bóng. Tập trung vào một quả bóng. Giả sử bóng sắp bị loại bỏ ngẫu nhiên (và không được quan sát), và sau đó một quả bóng sẽ được rút ra và quan sát. Không có sự khác biệt nào về thứ tự lựa chọn xảy ra, vì vậy bạn cũng có thể quan sát quả bóng đầu tiên được rút ra (và sau đó loại bỏ một quả bóng khác nếu bạn khăng khăng). Phân phối rõ ràng đã không thay đổi, bởi vì nó sẽ không bị ảnh hưởng bằng cách loại bỏ các quả bóng khác .k + 1 k kkk+1kk


Lập luận này - mặc dù hoàn toàn hợp lệ - có thể khiến một số người cảm thấy khó chịu. Các phân tích sau đây có thể được chấp nhận là nghiêm ngặt hơn, bởi vì nó không yêu cầu chúng tôi bỏ qua thứ tự lựa chọn.

Tiếp tục tập trung vào quả bóng của bạn. Nó sẽ có một số xác suất được chọn là bóng thứ . Mặc dù rất dễ tính toán, chúng ta không cần biết giá trị của nó: tất cả vấn đề là nó phải có cùng giá trị cho mỗi quả bóng (vì tất cả các quả bóng đều tương đương) và nó không khác nhau. Nhưng nếu nó bằng 0, sẽ không có bóng nào có xác suất được chọn: miễn là còn ít nhất một quả bóng, . k + 1 p k p k0pkk+1pkpk0

Hãy chú ý đến màu sắc một lần nữa. Theo định nghĩa, cơ hội mà một màu cụ thể sẽ được chọn (sau khi bóng được loại bỏ ngẫu nhiên) là tổng cơ hội của tất cả các quả bóng màu ban đầu chia cho tổng số cơ hội của tất cả các quả bóng ban đầu. Khi ban đầu có bóng màu và bóng, giá trị đó làk C k C C n nCkCkCCn

Prk(C)=kcpknpk=kcn.

Khi nó không phụ thuộc vào , QED .k<nk


Cảm ơn bạn đã bình luận. Nó giúp tôi hiểu các quy trình cơ bản hơn!
mjnichol

2

Hãy để phân phối vẽ một quả bóng duy nhất - sau khi đã vẽ quả bóng mà không thay thế - có phân phối phân loại được phân phối trên các phân phối phân loại như vậy .kE(Dk)Dk

Tôi đoán bạn đang hỏi liệu có phải là hằng số không.E(Dk)

Tôi nghĩ rằng nó là. Giả sử rằng cuối cùng bạn vẽ tất cả các quả bóng. Tất cả các hoán vị của các quả bóng đều có khả năng như nhau. Xác suất vẽ ban đầu là . Bạn có thể sắp xếp lại các lựa chọn của mình theo một hoán vị có khả năng như nhau, theo đó quả bóng được chọn đầu tiên của bạn được chọn cuối cùng, và quả bóng thứ hai được chọn của bạn được chọn trước. Quả bóng đó có kỳ vọng , phải bằng do tính đối xứng. Theo cảm ứng, đều bằng nhau.E(D0)E(D1)E(D0)E(Di)


Bạn có nghĩa là tôi đang hỏi liệu là hằng số cho mọi k, phải không? E(Dk)
mjnichol

@mjnichol phải
Neil G

0

"Phân phối dự kiến" không thay đổi. Người ta có thể sử dụng một đối số martingale! Tôi sẽ thêm như vậy vào câu trả lời sau (Tôi đang đi du lịch).

Phân phối, có điều kiện trên các lần rút trước (đối với các lần rút sau) chỉ thay đổi khi bạn thực sự quan sát các lần rút. Nếu bạn vẽ quả bóng từ chiếc bình bằng một bàn tay đóng chặt, và sau đó ném nó đi mà không quan sát màu sắc của nó (tôi đã sử dụng nhà hát đó một cách hiệu quả như trình diễn lớp học), phân phối không thay đổi. Thực tế này có một giải thích: Xác suất là về thông tin, Xác suất là một khái niệm thông tin.

Vì vậy, xác suất chỉ thay đổi khi bạn nhận được thông tin mới (đó là xác suất có điều kiện). Vẽ quả bóng và ném nó đi mà không quan sát nó không cung cấp cho bạn bất kỳ thông tin mới nào, vì vậy không có gì mới để điều kiện. Vì vậy, khi bạn đặt điều kiện vào tập thông tin thực tế, điều đó không thay đổi, do đó phân phối có điều kiện không thể thay đổi.

 EDIT

Bây giờ tôi sẽ không cung cấp nhiều chi tiết hơn cho câu trả lời này, chỉ thêm một tài liệu tham khảo: Hosam M. Mahmoud: "Pólya Urn Model" (Chapman & Hall), trong đó xử lý các mô hình urn như câu hỏi trong câu hỏi này, và cũng có nhiều khái quát hơn đề án, cũng bằng cách sử dụng các phương pháp martingale để có được kết quả giới hạn. Nhưng các phương pháp martingale không cần thiết cho câu hỏi trong bài này.


Phân phối (cho các lần rút sau) không thay đổi ngay cả khi bạn thực sự quan sát các lần rút. Tại sao nên quan sát bất cứ điều gì thay đổi bất cứ điều gì?
Neil G

1
@Neil Tôi nghĩ rằng kjetil đang đề cập đến điều kiện phân phối trên các trận hòa được quan sát .
Cá bạc

@Silverfish: Ah tôi hiểu rồi. Bạn nói đúng, lời xin lỗi của tôi.
Neil G

Tôi sẽ chỉnh sửa để rõ ràng hơn khi ở nhà trong một vài tuần. Cho bây giờ kỳ nghỉ ở
Venezuela
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.