Kết quả mạnh mẽ nhất về tối đa của iid Gaussian là gì? Được sử dụng nhiều nhất trong thực tế?


9

Cho iid, hãy xem xét các biến ngẫu nhiênX1,,Xn,N(0,1)

Zn:=max1inXi.

Câu hỏi: Kết quả "quan trọng" nhất về các biến ngẫu nhiên này là gì?

Để làm rõ "tầm quan trọng", kết quả nào có nhiều kết quả khác như hậu quả logic? Kết quả nào được sử dụng thường xuyên nhất trong thực tế?

Cụ thể hơn, dường như kiến ​​thức dân gian trong số các nhà thống kê (lý thuyết) cho rằng Zn "về cơ bản giống như" 2logn , ít nhất là không có triệu chứng. (Xem câu hỏi liên quan này .)

Tuy nhiên, có nhiều kết quả liên quan thuộc loại này và dường như đó là trường hợp hầu hết không tương đương, cũng không ngụ ý lẫn nhau. Ví dụ ,

(1)Zn2logna.s.1,

mà nếu không có gì khác cũng ngụ ý các kết quả tương ứng trong xác suất và phân phối.

Tuy nhiên, nó thậm chí không ngụ ý các kết quả dường như cũng liên quan (xem câu hỏi khác này ), như

(2)limnEZn2logn=1,

(đây là bài tập 2.17 trên trang 49 của ) hoặc kết quả văn hóa dân gian khác :

(3)EZn=2logn+Θ(1).

Không có triệu chứng, người ta cũng biết rằng với mỗi (xem ở đây để biết bằng chứng),n

(4)clognEZn2logn

đối với một số nhỏ . Kết quả tương tự cũng có thể được hiển thị cho, vì bị lệch rất nhiều.c|Zn|Zn

Bằng chứng về kết quả cuối cùng này đơn giản hơn nhiều so với bằng chứng về các kết quả khác. Hy vọng của tôi là kết quả tiệm cận đầu tiên sẽ bao hàm tất cả những người không có triệu chứng khác, để tôi có thể cảm thấy tự tin tập trung tất cả thời gian và năng lượng của mình để hiểu kết quả đó. Nhưng, một lần nữa, điều đó dường như không đúng , vì vậy bây giờ tôi không rõ nên tập trung vào điều gì.

Xem trang 265-267 của phiên bản thứ hai của Galambos, Lý thuyết tiệm cận về thống kê trật tự cực đoan , in năm 1987. Có lẽ nó cũng được nêu ở đâu đó trong phiên bản đầu tiên.

Boucheron, Lugosi, Massart, Bất đẳng thức tập trung: Một lý thuyết độc lập không đối xứng . Ngoài ra: Cuốn sách này thực sự trích dẫn Galambos cho kết quả trong câu hỏi, nhưng tôi không thể tìm thấy nó được đề cập ở bất cứ đâu trong Galambos - chỉ có kết quả đầu tiên tôi đề cập.


1
Bạn có biết rằng khi bạn sử dụng \ dot trong MathJax, kết quả đôi khi xuất hiện như thể bạn đã sử dụng \ ldots và đôi khi như thể bạn đã sử dụng \ cdots, tùy thuộc vào ngữ cảnh? Tôi đã thay thế \ chấm bằng \ ldots trong câu hỏi này.
X_1, \dots, X_n, \dots \sim \mathscr{N}(0,1)X1,,Xn,N(0,1)X_1, \ldots, X_n, \ldots \sim \mathscr{N}(0,1)X1,,Xn,N(0,1)
Michael Hardy

@MichaelHardy Oh tôi nghĩ nó luôn luôn là trung tâm. Cảm ơn đã sửa chữa!
Chill2Macht

Câu trả lời:


4

Trong bất kỳ ứng dụng xác suất nào, đối tượng cơ bản nhất là phân phối, với các khoảnh khắc và các thuộc tính giới hạn có thể lấy được từ điều này. Do đó, kết quả "quan trọng" nhất, theo nghĩa bạn đã mô tả, là hàm phân phối đầy đủ (tương đương, hàm mật độ tương ứng). Trong thực tế, kết quả phân phối này có lẽ ít sáng hơn so với một số thuộc tính tiệm cận cơ bản hơn mà bạn đã liệt kê. Mặc dù về mặt logic, nó ngụ ý những kết quả tiệm cận này, nhưng theo quan điểm của tôi, những kết quả đó có khả năng được chiếu sáng nhiều hơn trong việc hiểu bản chất thay đổi của giá trị cực đoan khi chúng ta thay đổi .FZn(z)=Φn(z)n

Rõ ràng từ câu hỏi của bạn rằng bạn có một sự hiểu biết tốt về các thuộc tính giá trị cực trị trong trường hợp tối đa các biến ngẫu nhiên bình thường tiêu chuẩn IID. Các thuộc tính này đều có nguồn gốc logic từ hàm phân phối cho , vì vậy đó là đối tượng cơ bản nhất trong công việc trong vấn đề này. Như trong nhiều trường hợp, đối tượng cơ bản nhất không nhất thiết phải là chiếu sáng nhất, và vì vậy bạn có thể sẽ thấy rằng bạn phải làm gì khi biết tất cả các kết quả và biết rằng chúng chiếu sáng các khía cạnh khác nhau của vấn đề.Zn


Cảm ơn câu trả lời này - tôi đánh giá cao nó. Bạn có biết một tài liệu tham khảo về cách lấy tất cả các thuộc tính này từ hàm phân phối cho không? Tôi đã rất khó khăn trong việc tìm kiếm bất cứ điều gì giải thích điều này, bởi vì tất cả đều là "văn hóa dân gian" hoặc "cầm tay". Zn
Chill2Macht

Đối với hồ sơ, tôi đã đọc các liên kết và họ không giúp đỡ. Đó là lý do tại sao tôi hỏi câu hỏi.
Chill2Macht

1
Tôi không có tài liệu tham khảo cụ thể để giới thiệu, nhưng tôi nghĩ những kết quả này sẽ được dẫn xuất trong sách về lý thuyết giá trị cực đoan. Tôi khuyên bạn nên bắt đầu bằng cách tìm kiếm một số văn bản cấp sau đại học về chủ đề đó và xem liệu bạn có thể tìm thấy các dẫn xuất ở đó không.
Ben - Tái lập Monica

1

WIP: Công việc đang tiến triển

Theo p. 370 trong số các phương pháp thống kê toán học năm 1946 của Cramer , xác địnhỞ đây là hàm phân phối tích lũy của phân phối chuẩn thông thường, . Theo kết quả của định nghĩa của nó, chúng tôi được đảm bảo rằng gần như chắc chắn.

Ξn=n(1Φ(Zn)).
ΦN(0,1)0Ξnn

Hãy xem xét một nhận thức nhất định của không gian mẫu của chúng tôi. Theo nghĩa này, vừa là hàm của và , và là hàm của và . Đối với cố định , chúng ta có thể coi là hàm xác định của và là hàm xác định của và , từ đó đơn giản hóa vấn đề. Chúng tôi mong muốn hiển thị kết quả giữ gần như chắc chắn tất cảωΩZnnωΞnZn,nωωZnnΞnZnnωΩ, cho phép chúng tôi chuyển kết quả của mình từ phân tích không xác định sang cài đặt không xác định.

Theo p. 374 trong số các Phương pháp thống kê toán học năm 1946 của Cramer , giả sử vào lúc này (tôi dự định quay lại và cung cấp bằng chứng sau) rằng chúng tôi có thể chỉ ra rằng (đối với bất kỳ ), việc mở rộng tiệm cận sau đây (sử dụng tích hợp bởi các bộ phận và định nghĩa của ):ωΩΦ

(~)2πnΞn= =1Zne-Zn22(1+Ôi(1Zn2))  mộtS  Zn.

Rõ ràng chúng ta có cho bất kỳ nào và gần như chắc chắn là một hàm tăng của là , do đó chúng tôi khẳng định trong phần tiếp theo đó cho (gần như chắc chắn tất cả) đã sửa :Zn+1ZnnZnnnω

Znn.

Do đó, theo sau chúng ta có (trong đó biểu thị sự tương đương tiệm cận ):~

2πnΞn~1Zne-1Zn2  mộtS  Znn.

Cách chúng tôi tiến hành những gì tiếp theo về cơ bản đối với phương pháp cân bằng chi phối và các thao tác của chúng tôi sẽ chính thức được chứng minh bằng bổ đề sau:

Bổ đề: Giả sử là và (do đó ). Sau đó, với bất kỳ hàm nào được hình thành thông qua các thành phần, phép cộng và phép nhân logarit và luật công suất (về cơ bản là bất kỳ hàm " polylog " nào), chúng ta cũng phải có :Nói cách khác, các hàm "polylog" như vậy bảo tồn sự tương đương tiệm cận .f(n)~g(n)nf(n)g(n)hn h ( f ( n ) ) ~ h ( g ( n ) )n

h(f(n))~h(g(n)).

Sự thật của bổ đề này là hệ quả của Định lý 2.1. như được viết ở đây . Cũng lưu ý rằng những gì tiếp theo chủ yếu là một phiên bản mở rộng (chi tiết hơn) của câu trả lời cho một câu hỏi tương tự được tìm thấy ở đây .

Lấy logarit của cả hai bên, chúng ta nhận được rằng:

(1)đăng nhập(2πΞn)-đăng nhậpn~-đăng nhậpZn-Zn22.

Đây là nơi Cramer hơi lồng lộn; anh ta chỉ nói "giả sử bị ràng buộc", chúng ta có thể kết luận blah blah blah. Nhưng cho thấy bị ràng buộc phù hợp gần như chắc chắn dường như thực sự không tầm thường. Dường như bằng chứng về điều này về cơ bản có thể là một phần của những gì được thảo luận trên trang 265-267 của Galambos, nhưng tôi không chắc chắn rằng tôi vẫn đang làm việc để hiểu nội dung của cuốn sách đó.ΞnΞn

Dù sao, giả sử người ta có thể chỉ ra rằngđăng nhậpΞn= =o(đăng nhậpn) - Z 2 n / 2 - log Z n , thì nó sẽ theo sau (vì thuật thống trị thuật ngữ ):-Zn2/2-đăng nhậpZn

-đăng nhậpn~-Zn22Zn~2đăng nhậpn.

Điều này là hơi tốt, vì nó đã là hầu hết những gì chúng tôi muốn thể hiện, mặc dù một lần nữa đáng lưu ý rằng về cơ bản nó chỉ là đá cái lon xuống đường, vì bây giờ chúng tôi phải thể hiện một số ràng buộc gần như chắc chắn của . Mặt khác, có cùng phân phối cho bất kỳ tối đa các biến ngẫu nhiên liên tục iid nào, do đó, điều này có thể dễ xử lý.ΞnΞn

Dù sao, nếu , thì rõ ràng người ta cũng có thể kết luận rằng cho mọi đó là là . Sử dụng bổ đề của chúng tôi về các hàm polylog bảo toàn tính tương đương tiệm cận ở trên, chúng ta có thể thay thế biểu thức này trở lại để có được:Zn~2đăng nhậpnZn~2đăng nhậpn(1+α(n))α(n)o(1)n(1)

đăng nhập(2πΞn)-đăng nhậpn~-đăng nhập(1+α)-12đăng nhập2-12đăng nhậpđăng nhậpn-đăng nhậpn-2αđăng nhậpn-α2đăng nhậpn.

-đăng nhập(Ξn2π)~đăng nhập(1+α)+12đăng nhập2+12đăng nhậpđăng nhậpn+2αđăng nhậpn+α2đăng nhậpn.

Ở đây chúng ta phải đi xa hơn nữa và giả sử rằng gần như chắc chắnđăng nhậpΞn= =o(đăng nhậpđăng nhậpn)  mộtS  n . Một lần nữa, tất cả Cramer nói là "giả sử bị ràng buộc". Nhưng vì tất cả mọi người đều có thể nói một tiên nghiệm về là , nên hầu như không rõ ràng rằng người ta nên có gần như chắc chắn, đó dường như là bản chất của yêu sách của Cramer.ΞnΞn0XTôinnΞn= =Ôi(1)

Nhưng dù sao đi nữa, giả sử người ta tin điều đó, thì nó tuân theo thuật ngữ thống trị không chứa là . Vì , theo sau và rõ ràng , vì vậy thuật ngữ chi phối chứa là . Do đó, chúng ta có thể sắp xếp lại và (chia mọi thứ cho hoặc ) thấy rằngα12đăng nhậpđăng nhậpnα= =o(1)α2= =o(α)đăng nhập(1+α)= =o(α)= =o(o(αđăng nhậpn))α2αđăng nhậpn12đăng nhậpđăng nhậpn2αđăng nhậpn

-12đăng nhậpđăng nhậpn~2αđăng nhậpnα~-đăng nhậpđăng nhậpn4đăng nhậpn.

Do đó, thay thế điều này trở lại ở trên, chúng ta có được rằng:

Zn~2đăng nhậpn-đăng nhậpđăng nhậpn22đăng nhậpn,

một lần nữa, giả sử chúng tôi tin một số điều nhất định về .Ξn

Chúng tôi thử lại kỹ thuật tương tự một lần nữa; vì , nên nó cũng theo đóZn~2đăng nhậpn-đăng nhậpđăng nhậpn22đăng nhậpn

Zn~2đăng nhậpn-đăng nhậpđăng nhậpn22đăng nhậpn(1+β(n))= =2đăng nhậpn(1-đăng nhậpđăng nhậpnsố 8đăng nhậpn(1+β(n))),

khi . Hãy đơn giản hóa một chút trước khi thay thế trực tiếp trở lại (1); chúng tôi nhận được rằng:β(n)= =o(1)

đăng nhậpZn~đăng nhập(2đăng nhậpn)+đăng nhập(1-đăng nhậpđăng nhậpnsố 8đăng nhậpn(1+β(n)))đăng nhập(Ôi(1))= =o(đăng nhậpn)~đăng nhập(2đăng nhậpn).

Zn22logn12loglogn(1+β)+(loglogn)28logn(1β)2o((1+β)loglogn)logn12(1+β)loglogn.

Thay thế điều này trở lại (1), chúng tôi thấy rằng:

log(2πΞn)lognlog(2logn)logn+12(1+β)loglognβlog(4πΞn2)loglogn.

Do đó, chúng tôi kết luận rằng gần như chắc chắn

Zn2lognloglogn22logn(1+log(4π)+2log(Ξn)loglogn)=2lognloglogn+log(4π)22lognlog(Ξn)2logn.

Điều này tương ứng với kết quả cuối cùng trên p.374 của Phương pháp thống kê toán học năm 1946 của Cramer ngoại trừ ở đây thứ tự chính xác của thuật ngữ lỗi không được đưa ra. Rõ ràng việc áp dụng một thuật ngữ này sẽ đưa ra thứ tự chính xác của thuật ngữ lỗi, nhưng dù sao thì dường như không cần thiết phải chứng minh kết quả về cực đại của các quy tắc chuẩn iid mà chúng ta quan tâm.


Cho kết quả của những điều trên, cụ thể là gần như chắc chắn:

()Zn2lognloglogn+log(4π)22lognlog(Ξn)2lognZn=2lognloglogn+log(4π)22lognlog(Ξn)2logn+o(1).

2. Sau đó, theo tuyến tính của kỳ vọng, nó theo sau:

EZn=2lognloglogn+log(4π)22lognE[log(Ξn)]2logn+o(1)EZn2logn=1E[logΞn]2logn+o(1).

Do đó, chúng tôi đã chỉ ra rằng

limnEZn2logn=1,

miễn là chúng ta cũng có thể chỉ ra rằng

E[logΞn]=o(logn).

Điều này có thể không quá khó để hiển thị vì một lần nữa có cùng phân phối cho mỗi biến ngẫu nhiên liên tục. Như vậy chúng ta có kết quả thứ hai từ trên.Ξn

1. Tương tự, chúng ta cũng có những điều trên gần như chắc chắn:

Zn2logn=1log(Ξn)2logn+o(1),.

Do đó, nếu chúng ta có thể chỉ ra rằng:

(*)log(Ξn)=o(logn) almost surely,

sau đó chúng tôi sẽ hiển thị kết quả đầu tiên từ phía trên. Kết quả (*) cũng có nghĩa rõ ràng ngụ ý một fortiori rằng , do đó cũng cho chúng ta kết quả đầu tiên từ phía trên.E[log(Ξn)]=o(logn)

Cũng lưu ý rằng trong bằng chứng ở trên ( ), chúng ta cần phải giả sử rằng gần như chắc chắn (hoặc ít nhất là một cái gì đó tương tự), để nếu chúng ta có thể hiển thị ( ) thì rất có thể chúng tôi cũng sẽ có quá trình cần thiết để hiển thị gần như chắc chắn, và do đó nếu chúng tôi có thể chứng minh rất có thể chúng tôi sẽ có thể đưa ra tất cả các kết luận sau đây.Ξn=o(logn)Ξn=o(logn)()

3. Tuy nhiên, nếu chúng ta có kết quả này, thì tôi không hiểu làm thế nào người ta cũng có , vì . Nhưng ít nhất có vẻ đúng làEZn=2logn+Θ(1)o(1)Θ(1)

EZn=2logn+O(1).


Vì vậy, có vẻ như chúng ta có thể tập trung vào việc trả lời câu hỏi làm thế nào để hiển thị rằng

Ξn=o(logn) almost surely.

Chúng tôi cũng sẽ cần thực hiện công việc khó khăn trong việc cung cấp bằng chứng cho (~), nhưng theo hiểu biết tốt nhất của tôi chỉ là tính toán và không liên quan đến lý thuyết xác suất, mặc dù tôi vẫn chưa ngồi xuống và thử nó.

Trước tiên, hãy trải qua một chuỗi các vấn đề tầm thường để viết lại vấn đề theo cách giúp giải quyết dễ dàng hơn (lưu ý rằng theo định nghĩa ):Ξn0

Ξn=o(logn)limnΞnlogn=0ε>0,Ξnlogn>ε only finitely many timesε>0,Ξn>εlogn only finitely many times.

Một người cũng có:

Ξn>εlognn(1F(Zn))>εlogn1F(Zn)>εlognnF(Zn)<1εlognnZninf{y:F(y)1εlognn}.

Tương ứng, xác định cho tất cả :n

un(ε)=inf{y:F(y)1εlognn}.

Do đó, các bước trên cho chúng ta thấy rằng:

Ξn=o(logn) a.s.P(Ξn=o(logn))=1P(ε>0,Ξn>εlogn only finitely many times)=1P(ε>0,Znun(ε) only finitely many times)=1P(ε>0,Znun(ε) infinitely often)=0.

Lưu ý rằng chúng ta có thể viết:

{ε>0,Znun(ε) infinitely often}=ε>0{Znun(ε) infinitely often}.

Các chuỗi trở nên lớn hơn đồng đều khi giảm, vì vậy chúng tôi có thể kết luận rằng các sự kiện đang giảm (hoặc ít nhất bằng cách nào đó đơn điệu) khi chuyển về . Do đó, tiên đề xác suất liên quan đến chuỗi sự kiện đơn điệu cho phép chúng ta kết luận rằng:un(ε)ε

{Znun(ε) infinitely often}
ε0

P(ε>0,Znun(ε) infinitely often)=P(ε>0{Znun(ε) infinitely often})=P(limε0{Znun(ε) infinitely often})=limε0P(Znun(ε) infinitely often).

Do đó, nó đủ cho thấy rằng với tất cả ,ε>0

P(Znun(ε) infinitely often)=0

bởi vì tất nhiên giới hạn của bất kỳ chuỗi không đổi là hằng số.

Đây là một phần của một kết quả búa tạ:

Định lý 4.3.1., Tr. 252 của Galambos, Lý thuyết tiệm cận về thống kê trật tự cực đoan , tái bản lần thứ 2. Đặt là các biến iid với hàm phân phối không biến đổi và liên tục chung và đặt là một chuỗi không tăng sao cho cũng không tăng. Sau đó, với , theo X1,X2,F(x)unn(1F(un))un<sup{x:F(x)<1}

P(Znun infinitely often)=0 or 1
j=1+[1F(uj)]exp(j[1F(uj)])<+ or =+.

Bằng chứng là kỹ thuật và mất khoảng năm trang, nhưng cuối cùng nó hóa ra là hệ quả của một trong những bổ đề Borel-Cantelli. Tôi có thể đi xung quanh để cố gắng cô đọng bằng chứng chỉ sử dụng phần cần thiết cho phân tích này cũng như chỉ các giả định trong trường hợp Gaussian, có thể ngắn hơn (nhưng có thể không phải) và nhập nó vào đây, nhưng nín thở không được khuyến khích. Lưu ý rằng trong trường hợp này , do đó điều kiện đó là trống và là do đó rõ ràng không giảm.ω(F)= =+n(1-F(n))εđăng nhậpn

Dù sao, vấn đề là, hấp dẫn với định lý này, nếu chúng ta có thể chỉ ra rằng:

Σj= =1+[1-F(bạnj(ε))]điểm kinh nghiệm(-j[1-F(bạnj(ε))])= =Σj= =1+[εđăng nhậpjj]điểm kinh nghiệm(-εđăng nhậpj)= =εΣj= =1+đăng nhậpjj1+ε<+.

Lưu ý rằng vì sự tăng trưởng logarit chậm hơn bất kỳ sự tăng trưởng nào của luật công suất đối với bất kỳ số mũ luật lũy thừa dương nào (logarit và hàm mũ là bảo toàn tính đơn điệu, vì vậy và bất đẳng thức trước đây luôn có thể được xem là giữ cho tất cả đủ lớn do thực tế là và một sự thay đổi của các biến), chúng ta có:đăng nhậpđăng nhậpnαđăng nhậpnđăng nhậpnnαnđăng nhậpnn

j=1+logjj1+εj=1+jε/2j1+ε=j=1+1j1+ε/2<+,

vì chuỗi p được biết là hội tụ cho tất cả và tất nhiên ngụ ý .p>1ε>01+ε/2>1

Do đó, sử dụng định lý trên, chúng tôi đã chỉ ra rằng với tất cả , , nghĩa là tóm tắt lại có nghĩa là gần như chắc chắn.ε>0P(Znun(ε) i.o.)=0Ξn=o(logn)

Chúng ta cần chỉ ra rằng . Điều này không tuân theo những điều trên, vì, vdlogΞn=o(loglogn)

1nlogn=o(logn),logn+loglogno(logn).

Tuy nhiên, được đưa ra một chuỗi , nếu người ta có thể hiển thị rằng cho tùy ý , thì nó sẽ tuân theo . Lý tưởng nhất là tôi muốn có thể hiển thị điều này cho bằng cách sử dụng bổ đề trên (giả sử nó thậm chí còn đúng), nhưng vẫn chưa thể (kể từ đó).xnxn=o((logn)δ)δ>0log(xn)=o(loglogn)Ξn

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.