Có bao nhiêu điều khoản lớn nhất trong


11

Hãy xem xét trong đó là iid và CLT giữ. Có bao nhiêu điều khoản lớn nhất cộng lại bằng một nửa tổng số? Ví dụ: 10 + 9 + 8 (10 + 9 + 8 + 1) / 2: 30% các điều khoản đạt khoảng một nửa tổng số.i=1N|Xi|X1,,XN

Xác định
sumbiggest( j;X1XN)sum of the j biggest of |X1||XN|
halfsum(N)the smallest j such that sumbiggest( j )sumbiggest(N)/2.

Có một kết quả tiệm cận chung cho Halfsum ( ) không? Một dẫn xuất đơn giản, trực quan sẽ tốt đẹp.N,μ,σ

(Một chút Monte Carlo cho thấy rằng đôi khi halfsum ( ) / 4 hoặc lâu hơn; có nghĩa là, lớn nhất 1/4 của thêm lên đến 1/2 tổng số. Tôi có được 0,24 cho halfnormal, 0,19 cho hàm mũ, cho = 20, 50, 100.)N X i N N NNN
Xi
NNN


3
Đừng mong đợi một kết quả phổ quát giống như CLT. Chẳng hạn, câu trả lời cho các biến thể đồng nhất (0,1) sẽ rất khác so với câu trả lời cho các biến thể đồng nhất (1000.191)!
whuber

Phải, Halfsum tất nhiên sẽ phụ thuộc vào trung bình và sd. Nhưng tại sao ~ N / 5 cho cấp số nhân?
chối

2
Không có triệu chứng, Denis, điểm cắt cho nửa giây sẽ là giá trị mà trong đó là pdf cho; câu hỏi yêu cầu ( là cdf cho ). Trong trường hợp phân phối thống nhất, bạn nhận được câu trả lời của @ Dilip; với cấp số nhân, . x 0 t f ( t ) d t = 1 / 2 f | X i | N ( 1 - F ( x ) ) F | X i | [ 0 , 1 ] x 0,186682 N N / 5x0xtf(t)dt=1/2f|Xi|N(1F(x))F|Xi|[0,1]x0.186682NN/5
whuber

Câu trả lời:


2

Không, không có kết quả tiệm cận chung. Đặt là thứ tự , trong đó là lớn nhất. x i x [ 1 ]x[1]x[N]xix[1]

Hãy xem xét hai ví dụ sau:

1) . Rõ ràng CLT giữ. Bạn chỉ cần quan sát cho. M = 1 M j = 1 | x [ j ] | 1P(x=0)=1M=1j=1M|x[j]|12N|xi|

2) . Rõ ràng CLT giữ. Bạn cần quan sát cho.M = N / 2 Σ M j = 1 | x [ j ] | 1P(x=1)=1M=N/2j=1M|x[j]|12N|xi|

Đối với một ví dụ không cần thiết, bản phân phối Bernoulli:

3) . Một lần nữa CLT giữ. Bạn cần của các quan sát để đáp ứng các điều kiện của bạn. Bằng cách thay đổi trong khoảng từ 0 đến 1, bạn có thể đến gần ví dụ 1 hoặc ví dụ 2 tùy thích.p N / 2 pP(x=1)=p, P(x=0)=1ppN/2p


4
Thực sự rõ ràng là câu trả lời có thể nằm trong khoảng từ đến , nhưng điều đó không ngụ ý sự không tồn tại của một kết quả chung. Những gì nó ngụ ý là chúng ta nên xem xét các câu trả lời trong đó phân số phụ thuộc vào một số thuộc tính của phân phối cơ bản như giá trị trung bình và SD của nó. Những điều đó là đủ, cùng với CLT, để cung cấp thông tin cụ thể và định lượng về cách được phân phối so với tổng của chúng, vì vậy thật hợp lý khi hy vọng vào kết quả như vậy. N / 2 x [ i ]0N/2x[i]
whuber

1

Dưới đây là một đối số thô đưa ra một ước tính hơi khác nhau cho các biến ngẫu nhiên phân bố đồng đều. Giả sử là các biến ngẫu nhiên liên tục được phân phối đồng đều trên . Sau đó, có giá trị trung bình . Giả sử rằng bằng một sự trùng hợp đáng ngạc nhiên và hoàn toàn không thể tin được, tổng tiền hoàn toàn bằng . Vì vậy, chúng tôi muốn ước tính có bao nhiêu giá trị lớn nhất của tổng cộng lên tới trở lên. Bây giờ, biểu đồ của mẫu ( rất lớn) được rút ra từ phân bố đồng đều gần như phẳng từ đến [ 0 , 1 ] i X i N / 2 N / 2 X N / 4 N N U [ 0 , 1 ] 0 1 x 0 < x < 1 ( 1 - x ) N x 1 ( 1 + x ) / 2 ( 1 - x ) N ( 1 +Xi[0,1]iXiN/2N/2XN/4NNU[0,1]01và như vậy đối với mọi , , có mẫu được phân phối gần như đồng đều giữa đến . Các mẫu này có giá trị trung bình và tổng bằng . Tổng vượt quá cho . Vì vậy, tổng số mẫu lớn nhất vượt quá .x0<x<1(1x)Nx1(1+x)/2N / 4 x 1 / (1x)N(1+x)/2)=(1x2)N/2N/4 (1-1/x1/2N/4(11/2)N0.3NN/4

Bạn có thể thử và khái quát điều này một chút. Nếu , thì với bất kỳ cho nào , chúng tôi muốn sao cho trong đó là bình thường với trung bình và phương sai . Do đó, dựa trên giá trị của , . Nhân với mật độ của và tích hợp (từ đến ) để tìm số mẫu trung bình lớn nhất sẽ vượt quá một nửa tổng ngẫu nhiên.Y x ( 1 - x 2 ) N / 2 = Y / 2 Y N / 2 N / 12 Y x = iXi=YYx(1x2)N/2=Y/2YN/2N/12Y YY=0Y=Nx=1(Y/N)YY=0Y=N


Khoảng cách giữa hai điểm bị giới hạn trong khoảng không thể được phân phối theo cấp số nhân vì khoảng cách phải nhỏ hơn trong khi một biến ngẫu nhiên theo hàm mũ đảm nhận các giá trị trong . Điều gì đúng là nếu là các biến ngẫu nhiên theo cấp số nhân độc lập, thì điều kiện trên , thống kê đơn hàng được phân phối đồng đều trong . Xem, ví dụ, câu hỏi và câu trả lời này trên trang web đồng hành math.SE. (còn tiếp)1 ( 0 , ) Y 1 , Y 2 , ... , Y n + 1(0,1)1(0,)Y1,Y2,,Yn+1Y ( 1 ) , Y ( 2 ) , ... , Y ( n ) ( 0 , α )Ymax=α Y(1),Y(2),,Y(n)(0,α)
Dilip Sarwate

Trong mọi trường hợp, đối số của tôi không sử dụng khoảng cách giữa các mẫu được đặt hàng từ phân phối thống nhất.
Dilip Sarwate

Bạn nói đúng, tôi đã hiểu lầm bạn. Như một câu hỏi phụ, không phải các mảnh giữa các điểm ngẫu nhiên thống nhất được phân bổ theo cấp số nhân, sau khi chia tỷ lệ - sự đảo ngược của q + a của bạn? [Quy tắc thanh gãy từ Dự án trình diễn Wolfram] ( trình diễn.wolfram.com / BrkenStickRule ) chắc chắn có vẻ theo cấp số nhân, phải có dễ dàng? bằng chứng.
chối

Hãy đặt câu hỏi phụ của bạn như một câu hỏi riêng biệt.
Dilip Sarwate

Bắt đầu, sau đó thấy độ dài phân phối xác suất , bạn có thể nhận xét ở đó.
denis

0

Giả sử X chỉ có các giá trị dương để loại bỏ giá trị tuyệt đối.

Nếu không có một bằng chứng chính xác, tôi nghĩ bạn phải giải quyết cho k

(1FX(k))E(X|X>=k)=12E(X) với F là hàm phân phối tích lũy cho X

và sau đó câu trả lời được đưa ra bằng cách lấy các giá trị cao nhất .n(1FX(k))

Logic của tôi là về mặt tổng thể của tất cả các giá trị cao hơn k nên về

n(1FX(k))E(X|X>=k)

và một cách không chính thức một nửa tổng số tiền là về

12nE(X) .

Mô phỏng số cho thấy kết quả giữ cho trường hợp đồng nhất (thống nhất trong ) trong đó và tôi nhận được . Tôi không chắc chắn nếu kết quả luôn giữ hoặc nếu nó có thể được đơn giản hóa hơn nữa, nhưng tôi nghĩ nó thực sự phụ thuộc vào hàm phân phối F.F ( k ) = k k = [0,1]F(k)=kk=(12)

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.