Hiển thị ước tính hội tụ đến phân vị thông qua thống kê đơn hàng


10

Đặt là một chuỗi các biến ngẫu nhiên iid được lấy mẫu từ phân phối ổn định alpha , với các tham số . α = 1,5 ,X1,X2,,X3nα=1.5,β=0,c=1.0,μ=1.0

Bây giờ hãy xem xét chuỗi , trong đó , với . Y j + 1 = X 3 j + 1 X 3 j + 2 X 3 j + 3 - 1 j = 0 , ... , n - 1Y1,Y2,,YnYj+1=X3j+1X3j+2X3j+31j=0,,n1

Tôi muốn ước tính phần trăm.0.01

Ý tưởng của tôi là thực hiện một mô phỏng Monte-Carlo:

l = 1;
while(l < max_iterations)
{
  Generate $X_1, X_2, \ldots, X_{3n}$ and compute $Y_1, Y_2, \ldots, Y_{n}$;
  Compute $0.01-$percentile of current repetition;
  Compute mean $0.01-$percentile of all the iterations performed;
  Compute variance of $0.01-$percentile of all the iterations performed;
  Calculate confidence interval for the estimate of the $0.01-$percentile;

  if(confidence interval is small enough)
    break;

}

Gọi giá trị trung bình của tất cả phần trăm mẫu được tính là và phương sai của họ , để tính khoảng tin cậy thích hợp cho , tôi dùng đến đến dạng mạnh của Định lý giới hạn trung tâm :- μ n σ 2 n μ0.01μ^nσ^n2μ

Đặt là một chuỗi các biến ngẫu nhiên iid với và . Xác định nghĩa của mẫu là . Sau đó, có phân phối chuẩn bình thường giới hạn, tức là E [ X i ] = μ 0 < V [ X i ] = σ 2 < μ n = ( 1 / n ) Σ n i = 1 X i ( μ n - μ ) / X1,X2,E[Xi]=μ0<V[Xi]=σ2<μ^n=(1/n)i=1nXiμ n -μ(μ^nμ)/σ2/n

μ^nμσ2/nnN(0,1).

định lý Slutksy để kết luận rằng

nμ^nμσ^n2nN(0,1).

Khi đó, khoảng khoảng tin cậy cho làμ(1α)×100%μ

z1-α/2(1-α/2)

Iα=[μ^nz1α/2σ^n2n,μ^n+z1α/2σ^n2n],
trong đó là chất lượng của phân phối chuẩn thông thường.z1α/2(1α/2)

Câu hỏi:

1) Cách tiếp cận của tôi có đúng không? Làm thế nào tôi có thể biện minh cho việc áp dụng CLT? Ý tôi là, làm thế nào tôi có thể chỉ ra rằng phương sai là hữu hạn? (Tôi có phải xem xét phương sai của không? Bởi vì tôi không nghĩ nó là hữu hạn ...)Yj

2) Làm thế nào tôi có thể chỉ ra rằng trung bình của tất cả các mẫu % được tính toán hội tụ với giá trị thực của %? (Tôi nên sử dụng số liệu thống kê đơn hàng nhưng tôi không chắc về cách mua; tài liệu tham khảo được đánh giá cao.)0,01 -0.010.01


3
Tất cả các phương pháp được áp dụng cho trung bình mẫu tại stats.stackexchange.com/questions/45124 cũng áp dụng cho các phân vị khác. Trên thực tế, câu hỏi của bạn giống hệt với câu hỏi đó nhưng chỉ thay thế phần trăm thứ 50 bằng phần trăm thứ nhất (hoặc 0,01 có lẽ?).
whuber

@whuber, câu trả lời của bạn cho câu hỏi đó là cực kỳ tốt. tuy nhiên, Glen_b tuyên bố, ở cuối bài đăng của mình (câu trả lời được chấp nhận), rằng tính quy phạm gần đúng "không giữ được lượng tử cực đoan, vì CLT không hoạt động ở đó (trung bình của Z sẽ không bình thường ). Bạn cần lý thuyết khác nhau cho các giá trị cực đoan ". Tôi nên quan tâm đến tuyên bố này như thế nào?
Maya

2
Tôi tin rằng anh ta không thực sự có nghĩa là lượng tử cực đoan , mà chỉ bản thân các thái cực . (Trên thực tế, anh ta đã sửa lỗi sai ở cuối câu tương tự, gọi chúng là "giá trị cực trị".) Điểm khác biệt là một lượng tử cực trị, chẳng hạn như phần trăm .01 (đánh dấu 1/10000 dưới cùng của phân phối) sẽ, trong giới hạn, sẽ ổn định vì ngày càng nhiều dữ liệu trong một mẫu sẽ vẫn giảm xuống dưới và ngày càng nhiều hơn sẽ nằm trên tỷ lệ phần trăm đó. Với một cực trị (như tối đa hoặc tối thiểu) không còn là trường hợp nữa.
whuber

Đây là một vấn đề cần được giải quyết nói chung bằng cách sử dụng lý thuyết quá trình thực nghiệm. Một số trợ giúp về mức độ đào tạo của bạn sẽ hữu ích.
AdamO

Câu trả lời:


2

Phương sai của không hữu hạn. Y Điều này là do biến ổn định alpha với ( phân phối Holtzmark ) có kỳ vọng hữu hạn nhưng phương sai của nó là vô hạn. Nếu có phương sai hữu hạn , thì bằng cách khai thác tính độc lập của và định nghĩa phương sai, chúng ta có thể tính toánα = 3 / 2 μ Y σ 2 X iXα=3/2μYσ2Xi

σ2=Var(Y)=E(Y2)E(Y)2=E(X12X22X32)E(X1X2X3)2=E(X2)3(E(X)3)2=(Var(X)+E(X)2)3μ6=(Var(X)+μ2)3μ6.

Phương trình bậc ba này trong có ít nhất một giải pháp thực sự (và tối đa ba giải pháp, nhưng không còn nữa), ngụ ý sẽ là hữu hạn - nhưng không phải vậy. Mâu thuẫn này chứng minh cho yêu sách.Var(X)Var(X)


Hãy chuyển sang câu hỏi thứ hai.

Bất kỳ lượng tử mẫu nào đều hội tụ đến lượng tử thực khi mẫu phát triển lớn. Một vài đoạn tiếp theo chứng minh điểm chung này.

Đặt xác suất liên quan là (hoặc bất kỳ giá trị nào khác trong khoảng từ đến , độc quyền). Viết cho hàm phân phối, sao cho là định lượng .q=0.0101FZq=F1(q)qth

Tất cả chúng ta cần giả sử là (hàm lượng tử) là liên tục. Điều này đảm bảo với chúng tôi rằng với bất kỳ cũng có xác suất và màF1ϵ>0q<qq+>q

F(Zqϵ)=q,F(Zq+ϵ)=q+,

và như , giới hạn của khoảng là .ϵ0[q,q+]{q}

Xem xét bất kỳ mẫu iid có kích thước . Số phần tử của mẫu này nhỏ hơn có phân phối Binomial , vì mỗi phần tử độc lập có cơ hội nhỏ hơn . Định lý giới hạn trung tâm (thông thường!) ý rằng với đủ lớn , số phần tử nhỏ hơn được đưa ra bởi một phân phối chuẩn với và phương sai (để một xấp xỉ tốt tùy ý). Đặt CDF của phân phối chuẩn là . Cơ hội mà số lượng này vượt quánZq(q,n)qZqnZqnqnq(1q)Φnq do đó gần tùy ý

1Φ(nqnqnq(1q))=1Φ(nqqq(1q)).

Vì đối số trên ở phía bên tay phải là bội số cố định của , nên nó phát triển lớn tùy ý khi phát triển. Vì là CDF, giá trị của nó tiếp cận gần bằng , cho thấy giá trị giới hạn của xác suất này bằng không.Φ nΦ1nnΦ1

Nói cách khác: trong giới hạn, gần như chắc chắn rằng của các phần tử mẫu không nhỏ hơn . Một đối số tương tự chứng minh rằng gần như chắc chắn rằng của các phần tử mẫu không lớn hơn . Nhìn chung, các hàm ý các quantile của một mẫu đủ lớn là rất có khả năng nói dối giữa .Z q - n q Z q + q Z q - ε Z q + εnqZqnqZq+qZqϵZq+ϵ

Đó là tất cả những gì chúng ta cần để biết rằng mô phỏng sẽ hoạt động. Bạn có thể chọn bất kỳ mức độ chính xác mong muốn nào và mức độ tin cậy và biết rằng đối với cỡ mẫu đủ lớn , thống kê thứ tự gần nhất với trong mẫu đó sẽ có ít nhất trong phạm vi của lượng thực .1 - α n n q 1 - α ϵ Z qϵ1αnnq1αϵZq


Đã thiết lập rằng một mô phỏng sẽ hoạt động, phần còn lại là dễ dàng. Giới hạn tin cậy có thể được lấy từ các giới hạn cho phân phối Binomial và sau đó được chuyển đổi ngược lại. Có thể tìm thấy giải thích thêm (cho định lượng , nhưng khái quát cho tất cả các lượng tử) có thể được tìm thấy trong các câu trả lời tại định lý giới hạn trung tâm cho các trung vị mẫu .q=0.50

Hình: biểu đồ 0,01 lượng tử của Y với n = 300 cho 1000 lần lặp

Lượng tử của là âm. Phân phối lấy mẫu của nó là rất sai lệch. Để giảm skew, con số này cho thấy một biểu đồ của logarit của âm 1.000 mẫu mô phỏng của giá trị của .Y n = 300 Yq=0.01Yn=300Y

library(stabledist)
n <- 3e2
q <- 0.01
n.sim <- 1e3

Y.q <- replicate(n.sim, {
  Y <- apply(matrix(rstable(3*n, 3/2, 0, 1, 1), nrow=3), 2, prod) - 1
  log(-quantile(Y, 0.01))
})
m <- median(-exp(Y.q))
hist(Y.q, freq=FALSE, 
     main=paste("Histogram of the", q, "quantile of Y for", n.sim, "iterations" ),
     xlab="Log(-Y_q)",
     sub=paste("Median is", signif(m, 4), 
               "Negative log is", signif(log(-m), 4)),
     cex.sub=0.8)
abline(v=log(-m), col="Red", lwd=2)
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.