Khoảng cách tối đa giữa các mẫu được rút ra mà không thay thế từ phân phối thống nhất rời rạc


16

Vấn đề này liên quan đến nghiên cứu trong phòng thí nghiệm của tôi về bảo hiểm robot:

Rút ngẫu nhiên n số từ tập {1,2,,m} mà không thay thế và sắp xếp các số theo thứ tự tăng dần. 1nm .

Từ danh sách được sắp xếp này gồm các số {a(1),a(2),,a(n)} , tạo ra sự khác biệt giữa các số liên tiếp và các ranh giới: g={a(1),a(2)a(1),,a(n)a(n1),m+1a(n)} . Điều này chokhoảng trốngn+1 .

Sự phân bố của khoảng cách tối đa là gì?

P(max(g)=k)=P(k;m,n)=?

Điều này có thể được đóng khung bằng cách sử dụng thống kê đơn hàng : P(g(n+1)=k)=P(k;m,n)=?

Xem liên kết để phân phối các khoảng trống , nhưng câu hỏi này yêu cầu phân phối khoảng cách tối đa .

Tôi hài lòng với giá trị trung bình, E[g(n+1)] .

Nếu n=m tất cả các khoảng trống là kích thước 1. Nếu n+1=m có một khoảng cách kích thước 2n+1 vị trí có thể. Kích thước khoảng cách tối đa là mn+1 và khoảng cách này có thể được đặt trước hoặc sau bất kỳ số n , với tổng số n+1 vị trí có thể. Kích thước khoảng cách tối đa nhỏ nhất là mnn+1 . Xác định xác suất của bất kỳ kết hợp đã cho nào T=(mn)1 .

Tôi đã giải quyết một phần hàm khối lượng xác suất là (1)P(g(n+1)=k)=P(k;m,n)={0k<mnn+11k=mnn+11k=1 (occurs when m=n)T(n+1)k=2 (occurs when m=n+1)T(n+1)k=m(n1)n?m(n1)nkmn+1T(n+1)k=mn+10k>mn+1

Công việc hiện tại (1): Phương trình cho khoảng cách đầu tiên, a(1) rất đơn giản:

P(a(1)=k)=P(k;m,n)=1(mn)k=1mn+1(mk1n1)
Giá trị mong đợi có giá trị đơn giản: E[P(a(1))]=1(mn)k=1mn+1(mk1n1)k=mn1+n . Bằng cách đối xứng, tôi hy vọng tất cả các khoảng trống n có phân phối này. Có lẽ giải pháp có thể được tìm thấy bằng cách rút ra từ phân phối này n lần.

Công việc hiện tại (2): thật dễ dàng để chạy mô phỏng Monte Carlo.

simMaxGap[m_, n_] := Max[Differences[Sort[Join[RandomSample[Range[m], n], {0, m+1}]]]];
m = 1000; n = 1; trials = 100000;
SmoothHistogram[Table[simMaxGap[m, n], {trials}], Filling -> Axis,
Frame -> {True, True, False, False},
FrameLabel -> {"k (Max gap)", "Probability"},
PlotLabel -> StringForm["m=``,n=``,smooth histogram of maximum map for `` trials", m, n, trials]][![enter image description here][1]][1]

1
Với những điều kiện này, bạn phải có n <= m. Tôi nghĩ bạn muốn g = {a_ (1), a_ (2) -a_ (1), ..., a_ (n) -a_ (n-1)}. Có phải chọn ngẫu nhiên có nghĩa là chọn từng số với xác suất 1 / m trong lần rút đầu tiên không? Vì bạn không thay thế xác suất sẽ là 1 / (m-1) vào lần thứ hai và cứ thế giảm xuống 1 trên lần rút thứ m nếu n = m. Nếu n <m, điều này sẽ dừng lại sớm hơn với lần rút cuối cùng có xác suất 1 / (m- (n-1)) trên lần rút thứ n.
Michael R. Chernick

2
Mô tả ban đầu của bạn về không có ý nghĩa gì, bởi vì (tôi tin) bạn đã chuyển đổi hai trong số các mục con. Vui lòng xác minh rằng chỉnh sửa của tôi phù hợp với ý định của bạn: cụ thể, vui lòng xác nhận rằng bạn muốn có khoảng trống, trong đó là lần đầu tiên. n a ( 1 )gna(1)
whuber

1
@gung Tôi nghĩ rằng đây là nghiên cứu, thay vì tự học
Glen_b -Reinstate Monica

1
Tôi nghĩ kích thước khoảng cách tối thiểu và tối đa của bạn phải là và . Kích thước khoảng cách tối thiểu là khi các số nguyên liên tiếp được chọn và kích thước khoảng cách tối đa xảy ra khi bạn chọn và số nguyên đầu tiên (hoặc và )m - n + 1 m n - 1 1 , Vay , n - 1 1 m - n + 2 , Khoan , m1mn+1mn11,,n11mn+2,,m
xác suất

1
Cảm ơn bạn Michael Chernick và xác suất, sửa chữa của bạn đã được thực hiện. Cảm ơn bạn @whuber đã thực hiện chỉnh sửa!
AaronBecker

Câu trả lời:


9

Đặt là cơ hội tối thiểu, , bằng ; nghĩa là, mẫu bao gồm và tập hợp của . Có các tập hợp con như vậy trong số các tập hợp con có khả năng như nhau, từ đóaf(g;n,m) ggn-1{g+1,g+2,Lôi,m}a(1)ggn1{g+1,g+2,,m}(mgn1)(mn)

Pr(a(1)=g=f(g;n,m)=(mgn1)(mn).

Thêm cho tất cả các giá trị có thể của lớn hơn sẽ mang lại hàm tồn tạik gf(k;n,m)kg

Pr(a(1)>g)=Q(g;n,m)=(mg)(mg1n1)n(mn).

Đặt là biến ngẫu nhiên được cho bởi khoảng cách lớn nhất:Gn,m

Gn,m=max(a(1),a(2)a(1),,a(n)a(n1)).

(Điều này trả lời cho câu hỏi như được đóng khung ban đầu, trước khi nó được sửa đổi để bao gồm một khoảng cách giữa và .) ma(n)m Chúng tôi sẽ tính toán hàm sinh tồn của nó từ đó toàn bộ phân phối của có nguồn gốc dễ dàng. Phương thức này là một chương trình động bắt đầu bằng , rõ ràng làG n , m

P(g;n,m)=Pr(Gn,m>g),
Gn,mn=1

(1)P(g;1,m)=Pr(G1,m>1)=mgm, g=0,1,,m.

Đối với lớn hơn , lưu ý rằng sự kiện là sự kết hợp rời rạc của sự kiệnG n , m > gn>1Gn,m>g

a1>g,

trong đó khoảng cách đầu tiên vượt quá và các sự kiện riêng biệtggg

a1=k and Gn1,mk>g, k=1,2,,g

trong đó khoảng cách đầu tiên bằng và khoảng cách lớn hơn xảy ra sau đó trong mẫu. Luật xác suất tổng thể khẳng định xác suất của những sự kiện này thêm vào, từ đógkg

(2)P(g;n,m)=Q(g;n,m)+k=1gf(k;n,m)P(g;n1,mk).

Sửa và đặt ra một mảng hai chiều được lập chỉ mục bởi và , chúng tôi có thể tính bằng cách sử dụng để điền vào hàng đầu tiên của nó và để điền vào từng hàng liên tiếp bằng các thao tác trên mỗi hàng. Do đó, bảng có thể được hoàn thành trong các hoạt động và tất cả các bảng cho đến có thể được xây dựng trong các hoạt động .i = 1 , 2 , Bắn , n j = 1 , 2 , Rời , m P ( g ; n , m ) ( 1 ) ( 2 ) O ( g m ) O ( g m n )gi=1,2,,nj=1,2,,mP(g;n,m)(1)(2)O(gm)O(gmn)g = m - n + 1 O ( m 3 n )g=1g=mn+1O(m3n)

Nhân vật

Các biểu đồ này cho thấy hàm tồn tại cho . Khi tăng, đồ thị di chuyển sang trái, tương ứng với khả năng giảm các khoảng trống lớn.gP(g;n,64)n=1,2,4,8,16,32,64n

Các công thức khép kín cho có thể thu được trong nhiều trường hợp đặc biệt, đặc biệt đối với lớn , nhưng tôi không thể có được một công thức khép kín áp dụng cho tất cả . Các xấp xỉ tốt có sẵn bằng cách thay thế vấn đề này bằng vấn đề tương tự cho các biến thống nhất liên tục.P(g;n,m)ng,n,m

Cuối cùng, kỳ vọng của có được bằng cách tính tổng hàm sinh tồn của nó bắt đầu từ :Gn,mg=0

E(Gn,m)=g=0mn+1P(g;n,m).

Hình 2: biểu đồ đường viền của kỳ vọng

Biểu đồ đường viền của kỳ vọng này cho thấy các đường viền ở , tốt nghiệp từ tối đến sáng.2,4,6,,32


Gợi ý: dòng "Đặt là biến ngẫu nhiên được cho bởi khoảng cách lớn nhất:", vui lòng thêm khoảng cách cuối cùng của . Âm mưu kỳ vọng của bạn phù hợp với mô phỏng Monte Carlo của tôi. m + 1 - a nGn,mm+1an
AaronBecker
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.