Tổng các sản phẩm của biến ngẫu nhiên Rademacher


9

Đặt là các biến ngẫu nhiên độc lập lấy các giá trị hoặc với xác suất 0,5 mỗi. Xét tổng . Tôi muốn giới hạn trên xác suất . Ràng buộc tốt nhất tôi có ngay bây giờ là trong đó c là hằng số phổ quát. Điều này đạt được bằng cách giới hạn thấp hơn xác suất Pr (| x_1 + \ dot + x_n | <\ sqrt {t})Pr (| y_1 + \ dot + y_n | <\ sqrt {t}) bằng cách áp dụng các giới hạn đơn giản của Chernoff. Tôi có thể hy vọng có được thứ gì đó tốt hơn đáng kể so với ràng buộc này không? Để bắt đầu, tôi ít nhất có thể nhận đượcx1xa,y1yb+11S=i,jxi×yjP(|S|>t)2ectmax(a,b)cPr(|x1++xn|<t)Pr(|y1++yn|<t)ectab . Nếu tôi có thể có được các đuôi phụ có thể là tốt nhất nhưng chúng ta có thể mong đợi điều đó (tôi không nghĩ vậy nhưng không thể nghĩ ra một cuộc tranh cãi)?


Bạn đã xem xét việc áp dụng ràng buộc trực tiếp với S chưa? Bạn có thể làm điều gì đó với
E[exp(λS]=E[λijXiYj]=E[λ(iXi)(jYj)]
Dilip Sarwate

Có một sự cải thiện rõ ràng trong ràng buộc của bạn đối với t>ab , khi đó xác suất phải bằng không. Dường như với tôi đó là một cái đuôi "Gaussian" :-). Dường như ràng buộc của bạn là không chính xác: các biến liên tục 1 thỏa mãn các điều kiện của câu hỏi này. Đối với a=bt=a21 xác suất là 1 nhưng ràng buộc của bạn là tiệm 2exp(ca)0a phát triển lớn.
whuber

Xác suất của tất cả các biến là 1 giảm theo cấp số nhân. Tôi không nghĩ rằng tôi hiểu bình luận của bạn. Với và , ràng buộc mà tôi đã nêu là khá đúng vì xác suất của tổng lớn hơn làt = a 2 - 1 t 2 - 1 2 - ( a - 1 )e - l n ( 2 ) c ( a - 1 / a )a=bt=a21t212(a1)eln(2)c(a1/a)
dùng1189053

1
Tôi thực sự xin lỗi về một sai lầm của tôi. Tôi nghĩ rằng tôi đã đề cập thống nhất ở trên. Vì vậy, p = 1/2 và chúng ta có thể lấy a và b lớn hơn bất kỳ hằng số nào (nếu cần) để giữ bất đẳng thức
user1189053

2
Trừ khi đôi mắt của tôi đang lừa dối tôi, bạn đang xem xét một tổng số sản phẩm, không phải là một sản phẩm tổng hợp. :-)
Đức hồng y

Câu trả lời:


7

Quan hệ đại số

S=i,jxiyj=ixijyj

trưng bày là sản phẩm của hai khoản tiền độc lập. Bởi vì và là độc lập Bernoulli variates, là một nhị thức biến mà đã được nhân đôi và thay đổi. Do đó, giá trị trung bình của nó là và phương sai của nó là . Tương tự có giá trị trung bình là và phương sai của . Hãy chuẩn hóa chúng ngay bây giờ bằng cách xác định( x i + 1 ) / 2 ( y j + 1 ) / 2 ( 1 / 2 ) X = Σ một i = 1 x i ( một , 1 / 2 ) 0 một Y = Σ b j = 1 y j 0 bS(xi+1)/2(yj+1)/2(1/2)X=i=1axi(a,1/2)0aY=j=1byj0b

Xa=1ai=1axi,

từ đâu

S=abXaXb=abZab.

Ở một mức độ cao (và định lượng) chính xác, như phát triển lớn phương pháp tiếp cận phân phối bình thường tiêu chuẩn. Do đó, chúng ta hãy tính xấp xỉ lần sản phẩm của hai quy tắc chuẩn.X một S aXaSab

Bước tiếp theo là để ý rằng

Zab=XaXb=12((Xa+Xb2)2(XaXb2)2)=12(U2V2).

là bội số của sự khác biệt của bình phương của các biến số chuẩn và độc lập . Phân phối của có thể được tính toán một cách phân tích (bằng cách đảo ngược hàm đặc trưng ): pdf của nó tỷ lệ thuận với hàm Bessel theo thứ tự zero, . Vì hàm này có đuôi theo cấp số nhân, chúng tôi kết luận ngay rằng với và cố định , không có xấp xỉ nào tốt hơn với so với câu hỏi.V Z a b K 0 ( | z | ) / π a b t Pr a , b ( S > t )UVZabK0(|z|)/πabtPra,b(S>t)

Vẫn còn một số chỗ cần cải thiện khi một (ít nhất) của và không lớn hoặc tại các điểm ở đuôi gần với . Các tính toán trực tiếp về phân bố của cho thấy độ cong giảm dần của xác suất đuôi tại các điểm lớn hơn nhiều so với , gần vượt quá . Các sơ đồ log-linear của CDF của cho các giá trị khác nhau của (được đưa ra trong các tiêu đề) và (nằm trong cùng các giá trị như , được phân biệt bằng màu sắc trong mỗi ô) cho thấy những gì đang diễn ra. Để tham khảo, biểu đồ giới hạnb S ± một b S abS±abSab SabaK0S0Pr(S>t)=Pr(-S<-t)abmax(a,b)SabaK0phân phối được hiển thị trong màu đen. (Vì đối xứng quanh , , do đó, nó đủ để nhìn vào đuôi âm.)S0Pr(S>t)=Pr(S<t)

Số liệu

Khi phát triển lớn hơn, CDF phát triển gần hơn với đường tham chiếu.b

Đặc trưng và định lượng độ cong này sẽ yêu cầu phân tích tốt hơn về xấp xỉ Bình thường với các biến thiên của Binomial.

Chất lượng của xấp xỉ hàm Bessel trở nên rõ ràng hơn trong các phần được phóng to (của góc trên bên phải của mỗi ô). Chúng ta đã đi khá xa vào đuôi. Mặc dù thang dọc logarit có thể che giấu sự khác biệt đáng kể, nhưng rõ ràng vào thời điểm đạt tới , phép tính gần đúng là tốt cho .500 | S | < Một a500|S|<ab

Miếng lót


Mã R để tính toán phân phối củaS

Sau đây sẽ mất một vài giây để thực hiện. (Nó tính vài triệu xác suất 36 sự kết hợp của và .) Trên máy chậm hơn, bỏ qua lớn hơn một hoặc hai giá trị của và và tăng giới hạn âm mưu thấp hơn từ lên khoảng .b 10 - 300 10 - 160abab1030010160

s <- function(a, b) {
  # Returns the distribution of S as a vector indexed by its support.
  products <- factor(as.vector(outer(seq(-a, a, by=2), seq(-b, b, by=2))))
  probs <- as.vector(outer(dbinom(0:a, a, 1/2), dbinom(0:b, b, 1/2)))
  tapply(probs, products, sum)
}

par(mfrow=c(2,3))
b.vec <- c(51, 101, 149, 201, 299, 501)
cols <- terrain.colors(length(b.vec)+1)
for (a in c(50, 100, 150, 200, 300, 500)) {
  plot(c(-sqrt(a*max(b.vec)),0), c(10^(-300), 1), type="n", log="y", 
       xlab="S/sqrt(ab)", ylab="CDF", main=paste(a))
  curve(besselK(abs(x), 0)/pi, lwd=2, add=TRUE)
  for (j in 1:length(b.vec)) {
    b <- b.vec[j]
    x <- s(a,b)
    n <- as.numeric(names(x))
    k <- n <= 0
    y <- cumsum(x[k])
    lines(n[k]/sqrt(a*b), y, col=cols[j], lwd=2)
  }
}

1
Hoàn thành rất tốt! Người ta có thể có được một hình thức chính xác cho cdf của sản phẩm của 2 Định mức tiêu chuẩn .. đối với đuôi âm 1/2 (1 + y BesselK[0,-y] StruveL[-1, y] - y BesselK[1,-y] StruveL[0, y]). Sẽ rất thú vị khi xem cách: (a) ràng buộc của OP thực hiện và (b) hiệu suất xấp xỉ bình thường của bạn, đối với trường hợp chúng tôi đã xem xét ở trên, tức là xuất phát từ giải pháp rời rạc chính xác. a=5,b=7
sói

1
@wolfies Vâng, tôi cũng nhận được biểu hiện đó: nó tích hợp đuôi của . Bởi vì phân phối chính xác không rời khỏi nó trong các đuôi cực đoan, nên nó dường như không còn mang giá trị phân tích của tích phân đó nữa. Bước tiếp theo hợp lý là một phân tích rõ ràng hơn về các đuôi, có nghĩa là vượt ra ngoài xấp xỉ Bình thường. K0
whuber

3

Nhận xét: Tôi đã chỉnh sửa tiêu đề trong nỗ lực phản ánh tốt hơn loại rv nào được xem xét trong câu hỏi. Bất cứ ai cũng cảm thấy tự do để chỉnh sửa.

Động lực: Tôi đoán không cần phải giải quyết giới hạn trên, nếu chúng ta có thể rút ra phân phối của. ( CẬP NHẬT : Chúng tôi không thể - xem ý kiến ​​và câu trả lời của Whuber).|Sab|

Biểu thị . Nó rất dễ dàng để xác minh rằng 's có sự phân bố tương tự như ' s và 's. Hàm tạo thời điểm làZ X YZk=XiYj,k=1,...,abZXY

MZ(t)=E[ezt]=12et+12et=cosh(t)

Ngoài ra , bắt đầu với , độc lập theo cặp: Biến (chỉ số có thể là bất kỳ), có hỗ trợ với xác suất tương ứng . Chức năng tạo thời điểm của nó làZW=Z1+Z2{2,0,2}{1/4,1/2,1/4}

MW(t)=E[e(z1+z2)t]=14e2t+12+14e2t==14(e2t+1)+14(e2t+1)=142etcosh(t)+142etcosh(t)=cosh(t)cosh(t)=MZ1(t)MZ2(t)

Tôi sẽ cố gắng nghi ngờ rằng sự độc lập hoàn toàn, như sau (có rõ ràng với những người khôn ngoan hơn không?): Đối với phần này, biểu thị . Sau đó, theo quy tắc chuỗi Zij=XiYj

P[Zab,...,Z11]=P[ZabZa,b1,...,Z11]...P[Z13Z12,Z11]P[Z12Z11]P[Z11]

Bằng sự độc lập theo cặp, chúng ta có . Hãy xem xét . và là điều kiện độc lập trên nên chúng ta có đẳng thức thứ hai bằng sự độc lập theo cặp. Nhưng điều này ngụ ý rằngP[Z12Z11]=P[Z12]
P[Z13,Z12Z11]Z13Z12Z11

P[Z13Z12,Z11]=P[Z13Z11]=P[Z13]

P[Z13Z12,Z11]P[Z12Z11]P[Z11]=P[Z13,Z12,Z11]=P[Z13]P[Z12]P[Z11]

Vv (tôi nghĩ). ( CẬP NHẬT : Tôi nghĩ sai . Độc lập có thể giữ cho bất kỳ bộ ba nào, nhưng không phải cho cả nhóm. Vì vậy, điều tiếp theo chỉ là sự phân phối của một bước đi ngẫu nhiên đơn giản, và không phải là một câu trả lời đúng cho câu hỏi - xem Wolfies 'và Câu trả lời của Whuber).

Nếu sự độc lập hoàn toàn thực sự giữ vững, chúng ta có nhiệm vụ tạo ra sự phân phối một tổng số iid lưỡng phân r_'s

Sab=k=1abZk

Trông giống như một bước đi ngẫu nhiên đơn giản , mặc dù không có sự giải thích rõ ràng về cái sau như một chuỗi.

Nếu thì hỗ trợ của sẽ là các số nguyên chẵn trong bao gồm 0, trong khi nếu thì hỗ trợ của sẽ là các số nguyên lẻ trong , không có số không. ab=evenS[ab,...,ab]ab=oddS[ab,...,ab]

Chúng tôi xử lý trường hợp . Suy ra là số lượng lấy giá trị . Sau đó, hỗ trợ của có thể được viết . Đối với bất kỳ trao , chúng tôi có được một giá trị duy nhất cho . Ngoài ra, do xác suất đối xứng và tính độc lập (hoặc chỉ có thể trao đổi?), Tất cả các nhận thức chung có thể có của -variabled đều có thể trang bị được. Vì vậy, chúng tôi đếm và chúng tôi thấy rằng hàm khối lượng xác suất của là,ab=odd
mZ1SS{ab2m;mZ+{0};mab}mSZ{Z1=z1,...,Zab=zab}S

P(S=ab2m)=(abm)12ab,0mab

Xác định và số lẻ theo cách xây dựng và yếu tố tiêu biểu cho sự hỗ trợ của , chúng ta cósab2mS

P(S=s)=(ababs2)12ab

Di chuyển đến, vì nếu , phân phối của đối xứng quanh 0 mà không phân bổ khối lượng xác suất về 0, và do đó phân phối củathu được bằng cách "gấp" biểu đồ mật độ xung quanh trục dọc, về cơ bản nhân đôi xác suất cho các giá trị dương,|S|ab=oddS|S|

P(|S|=|s|)=(ababs2)12ab1

Sau đó, chức năng phân phối là

P(|S||s|)=12ab11is,iodd(ababi2)

Do đó, với bất kỳ thực , , chúng tôi có xác suất bắt buộc t1t<ab

P(|S|>t)=1P(|S|t)=112ab11it,iodd(ababi2)

Lưu ý rằng chỉ báo đảm bảo rằng tổng sẽ chỉ chạy tối đa các giá trị được bao gồm trong hỗ trợ của- ví dụ: nếu chúng ta đặt , vẫn sẽ chạy tới , vì nó bị hạn chế là số lẻ, trên đầu là một số nguyên.i=odd|S|t=10.5i9


Số lượng giá trị âm trong phải là số chẵn . Do đó, bốn biến ngẫu nhiên này (tôi cho rằng chúng là bốn trong số các của bạn - ký hiệu không rõ ràng) không độc lập. (X1Y1,X1Y2,X2Y1,X2Y2)Z
whuber

@whuber Cảm ơn. Vấn đề (vấn đề của tôi, đó là), là tôi tiếp tục độc lập trong bất kỳ ví dụ cụ thể nào tôi làm. Tôi sẽ làm việc bốn biến cụ thể bạn viết.
Alecos Papadopoulos

Đúng, thật khó khăn vì các riêng biệt đều độc lập theo cặp và (tôi tin) bất kỳ ba riêng biệt nào cũng độc lập. (Tôi ủng hộ câu trả lời của bạn vì cuộc tấn công sáng tạo của nó vào vấn đề và tôi hy vọng tôi đã nhầm lẫn trong đánh giá về sự thiếu độc lập!)ZZ
whuber

@whuber Cảm ơn một lần nữa whuber, điều đó thực sự hỗ trợ. Tôi nghĩ rằng, những gì chúng ta cần để xuất phát phân phối là hợp lệ, là tất cả các sự kiện đều có thể được trang bị. Có thể cho một tài sản như vậy để giữ, trong khi độc lập chung thất bại? Ý tôi là, sự độc lập chung là đủ cho khả năng trang bị để giữ, nhưng nó cũng cần thiết phải không? S{k=1abZk}
Alecos Papadopoulos

Tôi sợ rằng tôi không hiểu ký hiệu của bạn, dường như đề cập đến một giao điểm của các biến ngẫu nhiên (bất cứ điều gì có thể có nghĩa).
whuber

3

Không phải là một câu trả lời, nhưng một nhận xét về câu trả lời thú vị của Alecos quá dài để phù hợp với một hộp bình luận.

Đặt là các biến ngẫu nhiên Rademacher độc lập và để là các biến ngẫu nhiên Rademacher độc lập. Alecos lưu ý rằng:(X1,...,Xa)(Y1,...,Yb)

Sab=k=1abZkwhereZk=XiYj

" Trông giống như một cuộc đi bộ ngẫu nhiên đơn giản . Nếu nó giống như một cuộc đi bộ ngẫu nhiên đơn giản, thì sự phân bố của sẽ là đối xứng" không đối xứng hình chuông "khoảng 0.S

Để minh họa rằng đó không phải là một cuộc đi bộ ngẫu nhiên đơn giản, đây là một so sánh nhanh về Monte Carlo:

  • chấm tam giác: Mô phỏng Monte Carlo của pmf của cho vàa = 5 b = 7Sa=5b=7
  • chấm tròn: Mô phỏng Monte Carlo của một bước đi ngẫu nhiên đơn giản với bướcn=35

nhập mô tả hình ảnh ở đây

Rõ ràng, không phải là một bước đi ngẫu nhiên đơn giản; cũng lưu ý rằng S không được phân phối trên tất cả các số nguyên chẵn (hoặc lẻ).S

Monte Carlo

Đây là mã (trong Mathicala ) được sử dụng để tạo một lần lặp duy nhất của tổng , được cho và :a bSab

 SumAB[a_, b_] :=  Outer[Times, RandomChoice[{-1, 1}, a], RandomChoice[{-1, 1}, b]] 
                         // Flatten // Total 

Sau đó, 500.000 đường dẫn như vậy, cho biết khi và , có thể được tạo bằng:b = 7a=5b=7

 data57 = Table[SumAB[5, 7], {500000}];

Miền hỗ trợ cho sự kết hợp giữa và này là:bab

{-35, -25, -21, -15, -9, -7, -5, -3, -1, 1, 3, 5, 7, 9, 15, 21, 25, 35}

1
+1 Một mô phỏng (hoặc một số ví dụ cụ thể như vậy) từ lâu đã cần thiết để cung cấp cho chúng tôi một tài liệu tham khảo để phân tích thêm. Mô phỏng của bạn có thể được thực hiện hiệu quả hơn nhiều (nhanh hơn khoảng 25 lần) bằng cách lưu ý rằng các yếu tố là . Điều đó ngay lập tức giải thích tại sao không có giá trị nguyên tố đủ lớn nào có thể hiển thị trong biểu đồ tam giác của bạn - và chứng minh một cách ép buộc rằng không thể có phân phối "bước ngẫu nhiên" (tỷ lệ nhị phân). ( i x i ) ( j y j ) SS(ixi)(jyj)S
whuber

1
Thay vì mô phỏng, bạn có thể nhanh chóng có được câu trả lời chính xác ( dù sao abcả dưới 1000, dù sao) như rademacher[a_] := Transpose[{Range[-a, a, 2], Array[Binomial[a, #] &, a + 1, 0] /2^a}]; s[a_, b_] := {#[[1, 1]], Total[#[[;; , 2]]]} & /@ GatherBy[Flatten[Outer[Times, rademacher[a], rademacher[b], 1], 1], First]; ListLogPlot[s[5, 7]] Hãy thử với, giả sử , s[100,211].
whuber

@whuber re bình luận đầu tiên - yếu tố của bạn là siêu gọn gàng! :) Trên máy Mac của tôi, sử dụng: ......... WHuberSumAB[a_, b_] := Total[RandomChoice[{-1, 1}, a]] * Total[RandomChoice[{-1, 1}, b]]... nó nhanh gấp đôi so với Outercách tiếp cận. Tò mò bạn đang sử dụng mã nào? [Tất nhiên, cả hai cách tiếp cận đều có thể được thực hiện nhanh hơn bằng cách sử dụng ParallelTable, v.v.]
sói

Hãy thử điều này : sum[n_, a_, b_] := Block[{w, p}, w[x_] := Array[Binomial[x, #] &, x + 1, 0] /2^x; p[x_] := RandomChoice[w[x] -> Range[-x, x, 2], n]; p[a] p[b]]. Rồi thời gian Tally[sum[500000, 5, 7]]. Đối với Raficianodos, sau đây làm điều tương tự và chỉ mất 50% dài hơn Mathematica : s <- function(n, a, b) (2 * rbinom(n, a, 1/2) - a)*(2 * rbinom(n, b, 1/2) - b); system.time(x <- table(s(5*10^5, 5, 7))); plot(log(x), col="#00000020").
whuber

@whuber - re comment2 - chính xác pmf: vì vậy bạn có , trong đó mỗi tổng của Rademacher là một Binomial, và vì vậy chúng tôi có sản phẩm của 2 Binomials. Tại sao không viết nó lên như một câu trả lời!? - nó đẹp, gọn gàng, thanh lịch và hữu ích ...S=(iXi)(jYj)
sói
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.