Là sự khác biệt giữa các số phân phối đồng đều phân phối đồng đều?


22

Chúng tôi lăn một cái chết 6 mặt một số lượng lớn.

Tính toán sự khác biệt (giá trị tuyệt đối) giữa một cuộn và cuộn trước của nó, sự khác biệt dự kiến ​​sẽ được phân phối đồng đều?

Để minh họa với 10 cuộn:

roll num  result diff
1           1     0
2           2     1
3           1     1
4           3     2
5           3     0
6           5     2
7           1     4
8           6     5
9           4     2
10          4     0

Các diffgiá trị sẽ được phân phối đồng đều?


13
Vẽ sơ đồ biểu đồ để ít nhất có ý nghĩa
giai điệu


Điều này trông giống như bài tập về nhà ....
Manu H

@Manu H, tôi đảm bảo với bạn những ngày làm bài tập về nhà đang ở phía sau tôi
HeyJude

Câu trả lời:


37

Không, nó không đồng nhất

Bạn có thể đếm khả năng tương đương nhau cho sự khác biệt tuyệt đối36

     second 1   2   3   4   5   6
first                           
1           0   1   2   3   4   5
2           1   0   1   2   3   4
3           2   1   0   1   2   3
4           3   2   1   0   1   2
5           4   3   2   1   0   1
6           5   4   3   2   1   0

cung cấp phân phối xác suất cho sự khác biệt tuyệt đối của

0    6/36  1/6
1   10/36  5/18
2    8/36  2/9
3    6/36  1/6
4    4/36  1/9
5    2/36  1/18

27
@onurcanbektas Bảng trong câu trả lời này rõ ràng mâu thuẫn với khẳng định của bạn: ví dụ, nó chỉ ra rằng một trong những khác biệt có thể là 5 trong khi 6 trong số đó là 0. Vì tất cả 36 khả năng đều có thể xảy ra như nhau, đó là không đồng nhất.
whuber

13
@onurcanbektas Tôi mời bạn một lần nữa để chiêm ngưỡng cái bàn. Vì nó chỉ có hai khác biệt tuyệt đối là 5, nên rõ ràng không có nhiều hơn hai khác biệt có thể bằng 5?
whuber

14
@onurcanbektas Đối với các khác biệt đơn giản (nghĩa là có dấu, nên số nguyên từ -5 đến +5), phân phối là phân bố tam giác rời rạc đối xứng với chế độ (giá trị rất có thể) ở 0. Đối với sự khác biệt tuyệt đối như trong câu trả lời của tôi, chế độ là 1.
Henry

2
Có thể đáng lưu ý rằng sự khác biệt đã ký modulo 6 được phân phối đồng đều, mặc dù.
Federico Poloni

2
@FedericoPoloni Đây có phải là không rõ ràng? Ý tôi là tôi chưa bao giờ thực sự nghĩ về nó, trước khi đọc bình luận, nhưng điều khá rõ ràng là điều này đơn giản phải là sự thật
Cruncher

21

Chỉ sử dụng các tiên đề cơ bản nhất về xác suất và số thực, người ta có thể chứng minh một tuyên bố mạnh mẽ hơn nhiều:

Sự khác biệt của bất kỳ hai giá trị ngẫu nhiên độc lập, phân phối giống hệt nhau không bao giờ có phân phối thống nhất rời rạc.XY

(Một tuyên bố tương tự cho các biến liên tục được chứng minh tại Thống nhất PDF về sự khác biệt của hai rv .)

Ý tưởng là cơ hội là một giá trị cực trị phải nhỏ hơn cơ hội bằng 0, bởi vì chỉ có một cách để (tối đa hóa) trong khi có nhiều cách để tạo ra sự khác biệt bằng 0, bởi vì và có phân phối giống nhau và do đó có thể bằng nhau. Đây là những thông tin chi tiết.XYXYXYXY

Trước tiên, hãy quan sát rằng hai biến và giả định trong mỗi câu hỏi chỉ có thể đạt được một số hữu hạn giá trị với xác suất dương, bởi vì sẽ có ít nhất khác biệt và phân phối đồng nhất gán cho chúng tất cả xác suất bằng nhau. Nếu là vô hạn, thì số chênh lệch có thể có dương, xác suất bằng nhau, vì vậy tổng số cơ hội của chúng sẽ là vô hạn, điều này là không thể.XYnnn

Tiếp theo , vì số lượng khác biệt là hữu hạn, sẽ có một số lớn nhất trong số chúng. Sự khác biệt lớn nhất chỉ có thể đạt được khi trừ đi giá trị nhỏ nhất của --let gọi nó là và giả sử nó có xác suất - từ giá trị lớn nhất của lệnh gọi --let mà một với Bởi vì và là độc lập, cơ hội của sự khác biệt này là sản phẩm của những cơ hội này,Ymq=Pr(Y=m)XMp=Pr(X=M).XY

(*)Pr(XY=Mm)=Pr(X=M)Pr(Y=m)=pq>0.

Cuối cùng , vì và có cùng phân phối, nên có nhiều cách khác biệt của chúng có thể tạo ra giá trị Trong số những cách này là các trường hợp và Bởi vì phân phối này là không quan trọng, khác với Điều đó cho thấy hai trường hợp đó là các sự kiện rời rạc và do đó chúng phải đóng góp ít nhất một số tiền cho khả năng bằng 0; đó là,XY0.X=Y=mX=Y=M.mM.p 2 + q 2 X - Yp2+q2XY

Pr(XY=0)Pr(X=Y=m)+Pr(X=Y=M)=p2+q2.

Kể từ khi hình vuông của con số này không tiêu cực, từ đâu chúng ta suy ra từ mà0(pq)2,()

Pr(XY=Mm)=pqpq+(pq)2=p2+q2pq<p2+q2Pr(XY=0),

cho thấy sự phân phối của không đồng đều, QED.XY

Chỉnh sửa để phản hồi bình luận

Một phân tích tương tự về sự khác biệt tuyệt đốiquan sát rằng vì và có cùng phân phối,Điều này đòi hỏi chúng ta phải họcKỹ thuật đại số tương tự mang lại kết quả gần như giống nhau, nhưng có khả năng vàHệ phương trình đó có nghiệm duy nhất|XY|XYm=M.Pr(XY=|Mm|)=2pq.2pq=2pq+(pq)22pq+p2+q2=1.p=q=1/2tương ứng với một đồng tiền công bằng (một "chết hai mặt"). Ngoài ngoại lệ này, kết quả cho sự khác biệt tuyệt đối cũng giống như sự khác biệt và vì những lý do cơ bản tương tự đã được đưa ra: cụ thể, sự khác biệt tuyệt đối của hai biến ngẫu nhiên iid không thể được phân phối đồng nhất bất cứ khi nào có nhiều hơn hai khác biệt rõ rệt với xác suất dương.

(kết thúc chỉnh sửa)


Hãy áp dụng kết quả này cho câu hỏi, câu hỏi về một cái gì đó phức tạp hơn một chút.

Mô hình mỗi cuộn chết độc lập (có thể là một khuôn không công bằng ) với biến ngẫu nhiên Sự khác biệt quan sát được trong cuộn này là các số Chúng ta có thể tự hỏi làm thế nào phân phối đồng đều các số này. Đó thực sự là một câu hỏi về các kỳ vọng thống kê: chẳng hạn, số lượng dự kiến ​​của bằng 0 là bao nhiêu? Số lượng dự kiến ​​của bằng bao nhiêu? Vân vân.Xi, i=1,2,,n.nΔXi=Xi+1Xi.n1ΔXiΔXi1

Khía cạnh vấn đề của câu hỏi này là là không độc lập: ví dụ, và liên quan đến cùng một cuộnΔXi Δ X 1 = X 2 - X 1 Δ X 2 = X 3 - X 2 X 2 .ΔX1=X2X1ΔX2=X3X2X2.

Tuy nhiên, đây không thực sự là một khó khăn. Vì kỳ vọng thống kê là phụ gia và tất cả các khác biệt có cùng phân phối, nếu chúng tôi chọn bất kỳ giá trị nào có thể có của chênh lệch, số lần dự kiến ​​chênh lệch bằng trong toàn bộ chuỗi cuộn chỉ bằng lần số dự kiến nhân số chênh lệch bằng trong một bước duy nhất của quy trình. Kỳ vọng một bước đó là (với mọi ). Những kỳ vọng này sẽ giống nhau cho tất cả (nghĩa là đồng nhất ) khi và chỉ khi chúng giống nhau cho mộtkknn1kPr(ΔXi=k)ikΔ X i . Δ X tôiΔXi. Nhưng chúng tôi đã thấy rằng không có phân phối đồng đều, ngay cả khi khuôn có thể bị sai lệch. Do đó, ngay cả trong ý nghĩa yếu hơn về tần số dự kiến ​​này, sự khác biệt của các cuộn không đồng nhất.ΔXi


@Michael Điểm hay: Tôi đã trả lời câu hỏi khi được hỏi (đó là về "sự khác biệt"), chứ không phải là minh họa (trong đó đề cập rõ ràng đến sự khác biệt tuyệt đối). Kỹ thuật tương tự được áp dụng - người ta chỉ cần xem xét cả sự khác biệt tối đa và tối thiểu. Trong trường hợp đó là hai khả năng duy nhất (cùng với số không), chúng ta có thể có được sự bằng nhau, đó là kết quả Bernoulli đến từ (cho thấy đó là ví dụ duy nhất như vậy). (1/2)
whuber

Một câu trả lời khác chứng minh một phiên bản cụ thể của điều này là ở đây .
Phục hồi

Cảm ơn, @Ben: Tôi đã quên chủ đề đó. Bởi vì nó là một tài liệu tham khảo tốt hơn, bây giờ tôi liên kết trực tiếp đến nó trong câu trả lời này.
whuber

12

Ở mức độ trực quan, một sự kiện ngẫu nhiên chỉ có thể được phân phối đồng đều nếu tất cả các kết quả của nó đều có khả năng như nhau.

Có phải như vậy đối với sự kiện ngẫu nhiên trong câu hỏi - sự khác biệt tuyệt đối giữa hai cuộn súc sắc?

Trong trường hợp này, đủ để xem xét các thái cực - những giá trị lớn nhất và nhỏ nhất mà sự khác biệt này có thể có là gì?

Rõ ràng 0 là nhỏ nhất (chúng tôi đang xem xét sự khác biệt tuyệt đối và các cuộn có thể giống nhau) và 5 là lớn nhất ( 6so với 1).

Chúng tôi có thể hiển thị sự kiện không đồng nhất bằng cách hiển thị 0nhiều khả năng xảy ra hơn (hoặc ít hơn) 5.

Nhìn thoáng qua, chỉ có hai cách để 5 xảy ra - nếu xúc xắc thứ nhất là 6 và thứ hai 1 hoặc ngược lại . Có bao nhiêu cách 0 có thể xảy ra?


1
+1 Tôi nghĩ rằng điều này đi vào trọng tâm của vấn đề. Tôi đã đăng một khái quát về câu hỏi mà cuối cùng dựa trên cùng một quan sát.
whuber

5

Như được trình bày bởi Henry, sự khác biệt của phân phối phân phối đồng đều không được phân phối đồng đều.

Để minh họa điều này với dữ liệu mô phỏng, chúng ta có thể sử dụng tập lệnh R rất đơn giản:

barplot(table(sample(x=1:6, size=10000, replace=T)))

nhập mô tả hình ảnh ở đây

Chúng tôi thấy rằng điều này thực sự tạo ra một phân phối thống nhất. Bây giờ chúng ta hãy xem phân phối sự khác biệt tuyệt đối của hai mẫu ngẫu nhiên từ phân phối này.

barplot(table(abs(sample(x=1:6, size=10000, replace=T) - sample(x=1:6, size=10000, replace=T))))

nhập mô tả hình ảnh ở đây


6
Tại sao điều này có liên quan đến CLT, liên quan đến phân phối tiệm cận của phương tiện với số lượng lớn các giá trị iid?
whuber

2
Tôi thích kết nối ban đầu bạn thực hiện với CLT . Gọi là số lượng mẫu được thêm (hoặc trừ) từ phân phối đồng phục ban đầu. CLT ngụ ý rằng đối với lớn , phân phối sẽ có xu hướng bình thường. Đến lượt điều này ngụ ý rằng phân phối không thể duy trì đồng nhất cho bất kỳ , chẳng hạn như , đó là những gì OP đang yêu cầu. (Nếu điều này không tự giải thích, hãy xem xét rằng nếu tổng được phân phối đồng đều khi , thì reindexing sẽ ngụ ý rằng nó cũng đồng nhất khi , v.v., kể cả đối với lớn .)n n > 1 n = 2 n = 2 n = 4 nnnn>1n=2n=2n=4n
krubo

3
@Krubo Câu hỏi ban đầu hỏi về sự phân bố sự khác biệt giữa các lần lăn liên tiếp. CLT không có gì để nói về điều đó. Thật vậy, cho dù con lăn được lăn bao nhiêu lần, sự phân phối của những khác biệt đó sẽ không tiếp cận được tính quy phạm.
whuber

Sự phân phối này có xu hướng đồng đều khi số lượng khuôn mặt có xu hướng vô cùng? Không chắc chắn làm thế nào để thể hiện điều đó, nhưng theo trực giác, nó có cảm giác như nó đi theo hướng đó, nhưng tôi không biết liệu nó có bị "chặn" một cách không có triệu chứng ở đâu đó trước khi làm phẳng đủ không
Cruncher

@Cruncher bạn có thể dễ dàng thay đổi số lượng khuôn mặt chết trong R-Code. Càng có nhiều mặt, tính chất cầu thang của phân phối càng rõ ràng. '1' luôn là đỉnh của cầu thang đó và với sự khác biệt lớn hơn, xác suất gần đúng bằng không. Ngoài ra, sự khác biệt của '0' hiếm hơn rõ rệt so với '1'. (ít nhất nếu giá trị nhỏ nhất của die là '1')
LuckyPal

2

Những người khác đã làm việc tính toán, tôi sẽ cho bạn một câu trả lời có vẻ trực quan hơn với tôi. Bạn muốn nghiên cứu tổng của hai unvrom rv (Z = X + (-Y)), phân phối tổng thể là sản phẩm tích chập (rời rạc):

P(Z=z)=k=P(X=k)P(Y=zk)

Tổng này khá trực quan: xác suất để có được , là tổng xác suất để có được một cái gì đó với X (ghi chú ở đây) và phần bù cho với -Y.zkz

Từ xử lý tín hiệu, chúng ta biết sản phẩm tích chập hoạt động như thế nào:

  • Tích chập của hai hàm đồng nhất (hai hình chữ nhật) sẽ cho một hình tam giác. Điều này được minh họa bởi wikipedia cho các chức năng liên tục:

nhập mô tả hình ảnh ở đây

  • Bạn có thể hiểu điều gì xảy ra ở đây: khi di chuyển lên (đường chấm dọc), miền chung của cả hai hình chữ nhật di chuyển lên rồi xuống, tương ứng với xác suất để có được .zz

  • Tổng quát hơn, chúng ta biết rằng các hàm duy nhất ổn định bằng tích chập là các hàm của gaussian familly. tức là chỉ phân phối gaussian ổn định bằng cách thêm (hay nói chung hơn là kết hợp tuyến tính). Điều này cũng có nghĩa là bạn không nhận được phân phối đồng đều khi kết hợp phân phối đồng đều.

Về lý do tại sao chúng ta nhận được những kết quả đó, câu trả lời nằm ở phân tách Fourrier của các hàm đó. Phép biến đổi Fourrier của sản phẩm tích chập là sản phẩm đơn giản của phép biến đổi Fourrier của mỗi hàm. Điều này cung cấp các liên kết trực tiếp giữa các hệ số bốnrier của hàm hình chữ nhật và tam giác.


Vui lòng kiểm tra tính hợp lệ của khiếu nại của bạn và logic câu trả lời của bạn. Câu hỏi không phải là liệu tích chập của hai phân phối đồng nhất có đồng nhất hay không: đó là liệu tích chập của một số phân phối và đảo ngược của nó có thể đồng nhất hay không. Và có nhiều gia đình phân phối hơn Gaussian ổn định theo tích chập (tất nhiên là chuẩn hóa modulo): xem en.wikipedia.org/wiki/Stable_distribution
whuber

Bạn đúng về phân phối ổn định. Đối với câu hỏi, tôi khá chắc chắn rằng đây là về sự khác biệt của hai giá trị ngẫu nhiên với phân phối đồng đều (như được chỉ ra bởi tiêu đề). Câu hỏi liệu sự tích chập của một số phân phối và sự đảo ngược của nó có thể đồng nhất lớn hơn những gì được hỏi ở đây không.
lcrmorin

1

Nếu và là hai cuộn xúc xắc liên tiếp, bạn có thể hình dung (với ) như sau trong đó mỗi màu tương ứng với một giá trị khác nhau của :xy|xy|=kk=0,1,2,3,4,5k

liên tiếp xúc xắc cuộn xúc xắc

Như bạn có thể dễ dàng thấy, số điểm cho mỗi màu không giống nhau; do đó, sự khác biệt không được phân phối đồng đều.


0

Đặt biểu thị sự khác biệt và giá trị của cuộn, sau đó DtXP(Dt=5)=P(Xt=6,Xt1=1)<P((Xt,Xt1){(6,3),(5,2)})<P(Dt=3)

Vậy hàm không đổi trong . Điều này có nghĩa là phân phối không đồng đều.P(Dt=d)d

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.