Phân phối mảnh lớn nhất của một thanh gãy (khoảng cách)


21

Để một thanh có độ dài 1 được chia thành các mảnh một cách ngẫu nhiên. Sự phân bố chiều dài của đoạn dài nhất là gì?k+1

Chính thức hơn, hãy để là IID và để là thống kê đơn hàng được liên kết, nghĩa là chúng ta chỉ cần đặt hàng mẫu theo cách sao cho . Đặt .(Bạn1,Giáo dụcBạnk)Bạn(0,1)(U(1),,U(k))U(1)U(2),,U(k)Zk=max(U(1),U(2)U(1),,U(k)U(k1),1U(k))

Tôi quan tâm đến việc phân phối Zk . Khoảnh khắc, kết quả tiệm cận hoặc xấp xỉ cho k cũng rất thú vị.


9
Đây là một vấn đề được nghiên cứu tốt; xem R. Pyke (1965), "Spacings", JRSS (B) 27 : 3, trang 395-449. Tôi sẽ cố gắng quay lại để thêm một số thông tin sau trừ khi có ai đó đánh bại tôi với thông tin đó. Cũng có một bài viết năm 1972 của cùng một tác giả (" Spacings revisited ") nhưng tôi nghĩ những gì bạn theo đuổi là khá nhiều trong phần đầu tiên. Có một số triệu chứng không có triệu chứngDevroye (1981) , "Luật của logarit lặp đi lặp lại cho thống kê đơn hàng của các khoảng cách thống nhất" Ann. Con mồi , 9 : 5, 860-867.
Glen_b -Reinstate Monica

4
Những người cũng nên cung cấp một số thuật ngữ tìm kiếm tốt để tìm công việc sau này nếu bạn cần nó.
Glen_b -Reinstate Monica

3
Điều này thật tuyệt. Tài liệu tham khảo đầu tiên rất khó tìm. Đối với những người quan tâm, tôi đặt nó trên The Grand Locus .
gui11aume

Vui lòng sửa lỗi in sai: Y(k) thay vì U(k) .
Viktor

Cảm ơn @Viktor! Đối với những việc nhỏ như vậy, đừng ngần ngại tự chỉnh sửa (Tôi nghĩ rằng nó sẽ được người dùng khác xem xét để phê duyệt).
gui11aume

Câu trả lời:


18

Với thông tin được cung cấp bởi @Glen_b tôi có thể tìm thấy câu trả lời. Sử dụng các ký hiệu giống như câu hỏi

P(Zkx)=j=0k+1(k+1j)(1)j(1jx)+k,

trong đó nếu và khác. Tôi cũng đưa ra kỳ vọng và sự hội tụ tiệm cận cho phân phối Gumbel ( NB : không phải Beta)a > 0 0a+=aa>00

E(Zk)=1k+1i=1k+11ilog(k+1)k+1,P(Zkx)exp(e(k+1)x+log(k+1)).

Tài liệu của các bằng chứng được lấy từ một số ấn phẩm được liên kết trong các tài liệu tham khảo. Chúng hơi dài, nhưng đơn giản.

1. Bằng chứng phân phối chính xác

Đặt là các biến ngẫu nhiên thống nhất IID trong khoảng . Bằng cách đặt hàng chúng, chúng tôi có được số liệu thống kê đơn hàng được ký hiệu . Các khoảng cách đồng đều được xác định là , với và . Các khoảng cách được đặt hàng là số liệu thống kê được sắp xếp tương ứng . Biến quan tâm là .( 0 , 1 ) k ( U ( 1 ) , Mạnh , U ( k ) ) Δ i = U ( i ) - U ( i - 1 )(U1,,Uk)(0,1)k(U(1),,U(k))Δi=U(i)U(i1)U ( k + 1 ) = 1 Δ ( 1 )U(0)=0U(k+1)=1 Δ ( k + 1 )Δ(1)Δ(k+1)Δ(k+1)

Đối với cố định , chúng tôi xác định biến chỉ báo . Theo đối xứng, vectơ ngẫu nhiên có thể trao đổi, do đó phân phối chung của một tập hợp con có kích thước giống như phân phối chung của đầu tiên . Bằng cách mở rộng sản phẩm, do đó chúng tôi có được1 i = 1 { Δ i > x }x(0,1)1tôi= =1{Δtôi>x}j j(11,Giáo dục,1k+1)jj

P(Δ(k+1)x)= =E(Πtôi= =1k+1(1-1tôi))= =1+Σj= =1k+1(k+1j)(-1)jE(Πtôi= =1j1tôi).

Bây giờ chúng tôi sẽ chứng minh rằng , sẽ thiết lập phân phối được đưa ra ở trên. Chúng tôi chứng minh điều này cho , vì trường hợp chung được chứng minh tương tự. j = 2E(Πtôi= =1j1tôi)= =(1-jx)+kj= =2

E(Πtôi= =121tôi)= =P(Δ1>xΔ2>x)= =P(Δ1>x)P(Δ2>x|Δ1>x).

Nếu , các điểm dừng nằm trong khoảng . Có điều kiện trong sự kiện này, các điểm dừng vẫn có thể trao đổi, do đó xác suất khoảng cách giữa điểm dừng thứ hai và điểm dừng thứ nhất lớn hơn giống như xác suất khoảng cách giữa điểm dừng đầu tiên và rào chắn bên trái (tại vị trí ) lớn hơn . Vì thếk ( xΔ1>xkx x x(x,1)xxx

P(Δ2>x|Δ1>x)= =P(tất cả các điểm là trong (2x,1)|tất cả các điểm là trong (x,1)),vì thếP(Δ2>xΔ1>x)= =P(tất cả các điểm là trong (2x,1))= =(1-2x)+k.

2. Kỳ vọng

Đối với các bản phân phối có hỗ trợ hữu hạn, chúng tôi có

E(X)=P(X>x)dx=1P(Xx)dx.

Tích hợp phân phối của , chúng tôi thu đượcΔ(k+1)

E(Δ(k+1))=1k+1j=1k+1(k+1j)(1)j+1j=1k+1j=1k+11j.

Bình đẳng cuối cùng là một biểu diễn cổ điển của các số hài , mà chúng tôi trình bày dưới đây.Hi=1+12++1i

Hk+1=011+x++xkdx=011xk+11xdx.

Với sự thay đổi của biến và mở rộng sản phẩm, chúng tôi thu đượcu=1x

Hk+1=01j=1k+1(k+1j)(1)j+1uj1du=j=1k+1(k+1j)(1)j+1j.

3. Thay thế xây dựng không gian thống nhất

Để có được sự phân bố tiệm cận của mảnh lớn nhất, chúng ta sẽ cần phải trưng bày một cấu trúc cổ điển của các khoảng cách đồng nhất dưới dạng các biến số mũ chia cho tổng của chúng. Mật độ xác suất của thống kê đơn hàng liên quan là(U(1),,U(k))

fU(1),U(k)(u(1),,u(k))=k!,0u(1)u(k+1).

Nếu chúng ta biểu thị các khoảng cách đồng đều , với , chúng ta thu đượcΔi=U(i)U(i1)U(0)=0

fΔ1,Δk(δ1,,δk)=k!,0δi++δk1.

Bằng cách xác định , do đó, chúng tôi có đượcU(k+1)=1

fΔ1,Δk+1(δ1,,δk+1)=k!,δ1++δk=1.

Bây giờ, hãy để là các biến ngẫu nhiên theo cấp số nhân của IID với giá trị trung bình 1 và đặt . Với một thay đổi đơn giản của biến, chúng ta có thể thấy rằng(X1,,Xk+1)S=X1++Xk+1

fX1,Xk,S(x1,,xk,s)=es.

Xác định , sao cho bằng cách thay đổi biến chúng ta thu đượcYi=Xi/S

fY1,Yk,S(y1,,yk,s)=skes.

Tích hợp mật độ này đối với , do đó chúng tôi có đượcs

fY1,Yk,(y1,,yk)=0skesds=k!,0yi++yk1,and thusfY1,Yk+1,(y1,,yk+1)=k!,y1++yk+1=1.

Vì vậy, phân phối chung của các khoảng cách đồng đều trên khoảng giống như phân phối chung của các biến ngẫu nhiên theo hàm mũ chia cho tổng của chúng. Chúng tôi đi đến sự tương đương sau đây của phân phốik+1(0,1)k+1

Δ(k+1)X(k+1)X1++Xk+1.

4. Phân phối tiệm cận

Sử dụng sự tương đương ở trên, chúng tôi có được

P((k+1)Δ(k+1)log(k+1)x)=P(X(k+1)(x+log(k+1))X1++Xk+1k+1)=P(X(k+1)log(k+1)x+(x+log(k+1))Tk+1),

trong đó . Biến này biến mất trong xác suất vì và . Không có triệu chứng, phân phối giống như của . Bởi vì là IID, chúng tôi cóTk+1=X1++Xk+1k+11E(Tk+1)=0Vmộtr(đăng nhập(k+1)Tk+1)= =(đăng nhập(k+1))2k+10X(k+1)-đăng nhập(k+1)Xtôi

P(X(k+1)-đăng nhập(k+1)x)= =P(X1x+đăng nhập(k+1))k+1= =(1-e-x-đăng nhập(k+1))k+1= =(1-e-xk+1)k+1~điểm kinh nghiệm{-e-x}.

5. Tổng quan về đồ họa

Biểu đồ dưới đây cho thấy sự phân phối của đoạn lớn nhất cho các giá trị khác nhau của . Với , tôi cũng đã phủ lên phân phối Gumbel không triệu chứng (đường mỏng). Gumbel là một xấp xỉ rất xấu cho các giá trị nhỏ của nên tôi bỏ qua chúng để không làm quá tải hình ảnh. Xấp xỉ Gumbel là tốt từ .kk= =10,20,50kk50

Phân phối mảnh lớn nhất của một thanh gãy

6. Tài liệu tham khảo

Các bằng chứng ở trên được lấy từ tài liệu tham khảo 2 và 3. Tài liệu được trích dẫn chứa nhiều kết quả hơn, chẳng hạn như phân phối các khoảng cách theo thứ tự của bất kỳ cấp bậc nào, phân phối giới hạn của chúng và một số cấu trúc thay thế của các khoảng cách thống nhất được đặt hàng. Các tài liệu tham khảo chính không dễ truy cập, vì vậy tôi cũng cung cấp các liên kết đến toàn văn.

  1. Bairamov và cộng sự. (2010) Giới hạn kết quả cho các khoảng cách thống nhất được đặt hàng , các giấy tờ Stat, 51: 1, trang 227-240
  2. Holst (1980) Về độ dài của các mảnh que bị gãy ngẫu nhiên , J. Appl. Dự luật, 17, tr 623-634
  3. Pyke (1965) Không gian , JRSS (B) 27: 3, trang 395-449
  4. Renyi (1953) Về lý thuyết thống kê đơn hàng , Acta math Hung, 4, tr. 191-231

Rực rỡ. Nhân tiện, có một tiệm cận được biết đến với không? E(Zk2)
Amir Sagiv

@AmirSagiv đây là một câu hỏi hay. Tôi đã xem nhanh các tài liệu tham khảo và tôi không thể tìm thấy nó. Tôi cũng không thể điều chỉnh các bằng chứng ở trên. Điều này khiến tôi nhận ra rằng tôi không biết sự phân bố của một hình vuông của Gumbel là gì. Có lẽ một nơi tốt để bắt đầu?
gui11aume

1
$ gui11aume Xem tại đây: mathoverflow.net/a/293381/42864
Amir Sagiv

1
@AmirSagiv Đây là một bài viết rất tốt. Vì một số lý do, tôi đã hiểu nhầm câu hỏi của bạn và nghĩ rằng bạn quan tâm đến phân phối tiệm cận của (mặc dù nhận xét của bạn rất rõ ràng), vì vậy nhận xét của tôi ở trên không liên quan lắm. Zk2
gui11aume

3

Đây không phải là một câu trả lời hoàn chỉnh, nhưng tôi đã thực hiện một số mô phỏng nhanh, và đây là những gì tôi thu được: Biểu đồ của đoạn dài nhất

Điều này có vẻ đáng chú ý là beta-ish, và điều này có ý nghĩa một chút, vì số liệu thống kê đơn hàng của các bản phân phối thống nhất iid là beta wiki .

Điều này có thể cung cấp một số điểm bắt đầu để rút ra pdf kết quả.

Tôi sẽ cập nhật nếu tôi nhận được một giải pháp đóng cuối cùng.

Chúc mừng!


Chỉ một điều nữa, hình dạng của biểu đồ để tăng k không thay đổi đáng kể, ngoài việc "bị cắt" gần bằng 0.
Lima

1
Cảm ơn bạn đã suy nghĩ của bạn @Lima (và chào mừng bạn đến với Xác thực chéo). Tôi nghĩ rằng câu trả lời của bạn có thể được cải thiện. Đầu tiên, tôi sẽ không đưa ra tuyên bố mà không có bằng chứng. Nếu điều này không chính xác, bạn có thể đưa những người nhìn thấy chủ đề này đi sai đường. Thứ hai, tôi sẽ ghi lại những gì bạn đã làm. Không có giá trị mà bạn đã sử dụng cũng như mã, con số không giúp được ai. Cuối cùng, tôi sẽ sao chép-chỉnh sửa câu trả lời và xóa mọi thứ không trực tiếp trả lời câu hỏi. k
gui11aume

1
Cảm ơn những lời đề nghị. Chúng hợp lệ ngoài trao đổi ngăn xếp, và tôi sẽ nhớ sử dụng chúng.
Lima

1

Tôi đã đưa ra câu trả lời cho một hội nghị ở Siena (Ý) vào năm 2005. Bài báo (2006) được trình bày trên trang web của tôi ở đây (pdf) . Các bản phân phối chính xác của tất cả các khoảng cách (nhỏ nhất đến lớn nhất) được tìm thấy trên các trang 75 & 76.

Tôi hy vọng sẽ trình bày về chủ đề này tại Hội nghị RSS ở Manchester (Anh) vào tháng 9 năm 2016.


2
Chào mừng đến với trang web. Chúng tôi đang cố gắng xây dựng một kho lưu trữ thông tin thống kê chất lượng cao vĩnh viễn dưới dạng câu hỏi và câu trả lời. Vì vậy, chúng tôi cảnh giác với các câu trả lời chỉ liên kết, do linkrot. Bạn có thể đăng một trích dẫn đầy đủ và một bản tóm tắt các thông tin tại liên kết, trong trường hợp nó bị chết? Ngoài ra, xin vui lòng không ký bài viết của bạn ở đây. Mỗi bài đăng có một liên kết đến trang người dùng của bạn, nơi bạn có thể đăng thông tin đó.
gung - Phục hồi Monica
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.