Nếu , , phân phối của gì?


9

Giả sử thiết lập sau:
Đặt . Ngoài ra . Hơn nữa tức là là sự kết hợp lồi của các ranh giới của các hỗ trợ tương ứng. là chung cho tất cả .Zi=min{ki,Xi},i=1,...,nXiU[ai,bi],ai,bi>0ki=cai+(1c)bi,0<c<1kici

Tôi nghĩ rằng tôi có phân phối đúng: đó là phân phối hỗn hợp . Nó có một phần liên tục, và sau đó là một phần rời rạc khối lượng xác suất tập trung:Zi

Xi[ai,ki),Zi=XiPr(Zizi)=ziaibiai

Pr(Zi=ki)=Pr(Xi>ki)=1Pr(Xiki)
=1kiaibiai=1(1c)(biai)biai=c

Vì vậy, trong tất cả

FZi(zi)={0zi<aiziaibiaiaizi<ki1kizi

trong khi đối với hàm khối lượng / mật độ "rời rạc / liên tục", nó nằm ngoài 0 [a_i, k_i] , nó có một phần liên tục là mật độ của một khối U (a_i, b_i) , \ frac {1} {b_i-a_i} nhưng với a_i \ le z_i <k_i và nó tập trung khối lượng xác suất dương c> 0 tại z_i = k_i .0[ai,ki]U(ai,bi)1biaiaizi<kic>0zi=ki

Trong tất cả, nó tổng hợp để thống nhất trên thực tế.

Tôi muốn có thể rút ra hoặc nói điều gì đó về phân phối và / hoặc khoảnh khắc của biến ngẫu nhiên Sni=1nZi , như n .

Giả sử, nếu là độc lập, có vẻ như là . Tôi có thể "bỏ qua" phần đó, thậm chí là gần đúng không? Sau đó, tôi sẽ được để lại một biến ngẫu nhiên nằm trong khoảng , trông giống như tổng số đồng phục bị kiểm duyệt, trên đường trở thành "không bị kiểm duyệt", và vì vậy có thể một số định lý giới hạn trung tâm ... nhưng có lẽ tôi đang chuyển hướng thay vì hội tụ ở đây, Vì vậy, bất kỳ đề nghị? Pr ( S n = n i k i ) = c n0 n [ n i = 1 a i ,XiPr(Sn=inki)=cn0n[i=1nai,i=1nki)

PS: Câu hỏi này có liên quan, Xuất phát phân phối tổng các biến bị kiểm duyệt , nhưng câu trả lời của @Glen_b không phải là điều tôi cần - Tôi phải làm việc này một cách phân tích, thậm chí sử dụng xấp xỉ. Đây là nghiên cứu, vì vậy hãy coi nó như bài tập về nhà - các đề xuất chung hoặc tài liệu tham khảo về văn học là đủ tốt.


Nếu bạn cần điều đó, hãy viết phân phối của là , với một phù hợp , trong đó là tập hợp Borel. μ Z i ( B ) = P ( Z iB ) = B g ( t )Zig BμZi(B)=P(ZiB)=Bg(t)dt+cIB(ki)gB
Zen

@Zen Tôi đã viết trong câu hỏi rằng phân phối không liên tục. Ngoài ra, RHS của cho thấy rõ ràng rằng này đại diện cho mật độ trong , nhưng với xác suất cho - và tôi thích ký hiệu nhỏ gọn hơn. f [ a i , k i ) k iff[ai,ki)ki
Alecos Papadopoulos

Theo tôi biết, ký hiệu này với là pdf và pmf không tồn tại; và chúng tôi có ngôn ngữ toán học thích hợp để mô tả chính xác các phân phối hỗn hợp. Tôi nghi ngờ ký hiệu này sẽ được chấp nhận khi bạn xuất bản nghiên cứu của mình. Hiển nhiên đó chỉ là ý kiến ​​của tôi thôi. Bạn nên luôn luôn làm theo cách bạn thích. f
Zen

@Zen Publishing là một chặng đường dài phía trước - và thực sự, các nhà phê bình cau mày khi thấy ký hiệu không được thiết lập. Điều này chỉ là một tốc ký khi người ta muốn mô tả một phân phối từng bước trong nhiều dòng. Không có "đối số có lợi" của nó và chống lại ký hiệu đã được thiết lập, ví dụ như đối số bạn đã sử dụng trong một nhận xét trước đó.
Alecos Papadopoulos

Câu trả lời:


5

Tôi sẽ làm theo mẹo của Henry và kiểm tra Lyapunov với . Thực tế là các bản phân phối được trộn lẫn không phải là một vấn đề, miễn là hành của và hoạt động đúng. Mô phỏng trường hợp cụ thể trong đó , , cho mỗi cho thấy tính quy phạm là ok.a i b i a i = 0 i 1δ=1aibiai=0k i = 2 / 3bi=1ki=2/3i1

xbar <- replicate(10^4, mean(pmin(runif(10^4), 2/3)))
hist((xbar - mean(xbar)) / sd(xbar), breaks = "FD", freq = FALSE)
curve(dnorm, col = "blue", lwd = 2, add = TRUE)

CLT


Quả thực khá bình thường. Tốt để biết. Các điều kiện thông thường cho CLT không bao giờ là một vấn đề ở đây, câu hỏi của tôi là liệu có những vấn đề khác, có lẽ tinh tế làm xoắn kết quả tiệm cận và yêu cầu CLT sửa đổi. Mô phỏng của bạn cho thấy rằng thực sự sự gián đoạn rời rạc trở nên không đáng kể về xác suất khi có nhiều biến số nhập vào tổng.
Alecos Papadopoulos

Không có gì cụ thể, nhưng họ không đặt ra bất kỳ vấn đề. Hãy nghĩ về chúng cũng là những con số hữu hạn, độc lập với chỉ số . Chúng có thể tăng hoặc giảm khi phát triển (không có quy tắc cụ thể) và không có bất kỳ một trong số chúng lớn hơn một cách không tương xứng so với các loại khác ... chúng thể hiện sự khác biệt về kích thước của các thực thể "có thể so sánh". Vì vậy, điều kiện của Lindeberg chắc chắn được giữ vữngiii
Alecos Papadopoulos

Đẹp. Chúc may mắn với các bước tiếp theo. Trông giống như một vấn đề thú vị.
Zen

3

Gợi ý:

Giả sử là cố định và độc lập thì bạn có thể tính trung bình và phương sai của mỗi : ví dụ và bạn biết . X i μ i σ 2 i Z i μ i = E [ Z i ] = c a i + k icXiμiσi2Ziki=cai+(1-c)biμi=E[Zi]=cai+ki2+(1c)kiki=cai+(1c)bi

Sau đó, việc cung cấp và không phát triển quá nhanh, bạn có thể sử dụng các điều kiện Lyapunov hoặc Lindeberg để áp dụng định lý giới hạn trung tâm với kết luận rằng hội tụ phân phối theo tiêu chuẩn thông thường hoặc theo nghĩa vẫy tay được phân phối bình thường với trung bình và phương sai .aibi11nσi2(1nZi1nμi)1nZi1nμi1nσi2


Cảm ơn. Không có vấn đề gì với và , chúng không phát triển theo chỉ số, chúng chỉ dao động xung quanh. Vì vậy, về cơ bản, bạn đang nói rằng CLT có thể bao gồm cả các biến ngẫu nhiên với các phân phối hỗn hợp? aibi
Alecos Papadopoulos

Ví dụ, và được cố định, thì bạn sẽ có các biến ngẫu nhiên phân phối độc lập với phương sai hữu hạn, do đó định lý giới hạn trung tâm sẽ được áp dụng. Cho dù đây là một phân phối hỗn hợp hay không không ảnh hưởng đến kết quả này. Điều tôi đang nói là bạn có thể mở rộng điều này cho các trường hợp trong đó các biến ngẫu nhiên là độc lập nhưng không được phân phối giống hệt nhau, miễn là phương tiện và phương sai vẫn hợp lý. aibi
Henry

2

Lo lắng chính của tôi trong câu hỏi này là liệu người ta có thể áp dụng CLT "như bình thường" trong trường hợp tôi đang kiểm tra hay không. Người dùng @Henry khẳng định rằng người ta có thể, người dùng @Zen đã thể hiện điều đó thông qua một mô phỏng. Do đó khuyến khích, bây giờ tôi sẽ chứng minh nó một cách phân tích.

Điều tôi sẽ làm trước tiên là xác minh rằng biến này với phân phối hỗn hợp có chức năng tạo khoảnh khắc "thông thường". Biểu thị giá trị kỳ vọng của , độ lệch chuẩn của nó, và phiên bản làm trung tâm và quy mô của bởi . Áp dụng công thức thay đổi biến, chúng tôi thấy rằng phần liên tục là Hàm tạo thời điểm của nên μiZiσiZiZ~i=Ziμiσi

fZ~(z~i)=σifZ(zi)=σibiai
Z~i
M~i(t)=E(ez~it)=ez~itdFZ~(z~i)=a~ik~iσiez~itbiaidzi+cek~it

M~i(t)=σibiaiek~itea~itt+cek~it
với
k~i=kiμiσi,a~i=aiμiσi

Sử dụng các số nguyên tố để biểu thị các đạo hàm, nếu chúng ta đã chỉ định hàm tạo mô men chính xác thì chúng ta sẽ nhận được vì đây là một biến ngẫu nhiên tập trung và tỷ lệ. Và thực tế, bằng cách tính toán các công cụ phái sinh, áp dụng quy tắc L'Hopital nhiều lần, (vì giá trị của MGF bằng 0 phải được tính thông qua các giới hạn) và thực hiện các thao tác đại số, tôi đã xác minh hai đẳng thức đầu tiên. Bình đẳng thứ ba tỏ ra quá mệt mỏi, nhưng tôi tin rằng nó giữ được.

M~i(0)=1,M~i(0)=E(Z~)=0M~i(0)=E(Z~i2)=Var(Z~i)=1

Vì vậy, chúng tôi có một MGF thích hợp. Nếu chúng ta thực hiện việc mở rộng Taylor bậc 2 về 0, chúng ta có

M~(t)=M~(0)+M~(0)t+12M~(0)t2+o(t2)

M~(t)=1+12t2+o(t2)

Điều này ngụ ý rằng hàm đặc trưng là (ở đây biểu thị đơn vị tưởng tượng) .i

ϕ~(t)=1+12(it)2+o(t2)=112t2+o(t2)

Theo các thuộc tính của hàm đặc trưng , chúng ta có hàm đặc trưng của bằngZ~/n

ϕ~Z~/n(t)=ϕ~Z~(t/n)=1t22n+o(t2/n)

và vì chúng ta có các biến ngẫu nhiên độc lập, nên hàm đặc trưng của là1ninZ~i

ϕ~1ninZ~i(t)=i=1nϕ~Z~(t/n)=i=1n(1t22n+o(t2/n))

Sau đó

limnϕ~1ninZ~i(t)=limn(1t22n)n=et2/2

bằng cách số được biểu diễne . Điều đó xảy ra rằng thuật ngữ cuối cùng là hàm đặc trưng của phân phối chuẩn thông thường và theo định lý liên tục của Levy , chúng ta có điều đó

1ninZ~idN(0,1)

đó là CLT. Lưu ý rằng thực tế là các biến - không được phân phối giống hệt nhau, "biến mất" khỏi chế độ xem sau khi chúng tôi xem xét các phiên bản trung tâm và tỷ lệ của chúng xem xét việc mở rộng Taylor bậc 2 của MGF / CHF của chúng: ở mức xấp xỉ đó, các hàm này là giống hệt nhau và tất cả các khác biệt được nén trong các điều khoản còn lại sẽ biến mất một cách không có triệu chứng. Z

Thực tế là hành vi bình dị ở cấp độ cá nhân, từ tất cả các yếu tố riêng lẻ, tuy nhiên sẽ biến mất khi chúng ta xem xét hành vi trung bình, tôi tin rằng nó được thể hiện rất tốt bằng cách sử dụng một sinh vật khó chịu như một biến ngẫu nhiên có phân phối hỗn hợp.


Thật tuyệt, Alecos. Cảm giác của tôi là đối số nên phụ thuộc vào các điều kiện cụ thể hơn trên 's và ' s. Ví dụ: liệu bằng chứng phá vỡ nếu nhanh chóng? (Tôi biết trong ứng dụng của bạn điều này không xảy ra.) Bạn nghĩ gì? b i ( b i - a i ) 0aibi(biai)0
Zen

@Zen Vấn đề liên quan đến phương sai của rv độc lập nhưng không phân phối giống hệt nhau là một vấn đề rất tinh vi, tôi không nghĩ rằng tôi vẫn hiểu rõ về nó. Các điều kiện Lyapunov hoặc Lindeberg đã biết chỉ đủ để CLT giữ. Có những trường hợp CLT giữ mặc dù những điều kiện này không. Vì vậy, tôi nghĩ rằng nếu chúng ta không ràng buộc các phương sai, thì không có câu trả lời duy nhất và vấn đề trở nên hoàn toàn cụ thể. Ngay cả cuốn sách của Billingsley cũng không rõ ràng về vấn đề này. Câu hỏi là phần còn lại sẽ trông như thế nào, và chúng ta có thể nói gì về nó.
Alecos Papadopoulos
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.