làm công cụ ước tính lượng tử cho lượng tử 1% của


8

Gần đây tôi đã tìm thấy công cụ ước lượng lượng tử sau đây cho một biến ngẫu nhiên liên tục trong một bài báo (phi kinh tế, áp dụng): đối với một vectơ dài 100 x , lượng tử 1% được ước tính với tối thiểu(x) . Dưới đây là cách nó thực hiện: bên dưới là biểu đồ mật độ hạt nhân của việc thực hiện ước tính tối thiểu(x) từ 100.000 lần chạy mô phỏng của các mẫu dài 100 từ phân phối N(0,1) . Đường thẳng là giá trị thực, tức là lượng tử 1% theo lý thuyết của phân bố N(0,1) . Mã cho mô phỏng cũng được đưa ra.

nhập mô tả hình ảnh ở đây

M=10e5; n=100
quantiles=rep(NA,M)
for(i in 1:M){ set.seed(i); quantiles[i]=min(rnorm(n)) }
plot(density(quantiles),main="Kernel density estimate of quantiles from M=100,000 simulation runs"); abline(v=qnorm(1/n))

Biểu đồ trông tương tự về mặt chất lượng cho phân phối (chỉ là một ví dụ). Trong cả hai trường hợp, công cụ ước tính đều bị sai lệch. Nếu không so sánh với một số người ước tính khác, tuy nhiên rất khó để nói nó tốt như thế nào. Do đó, câu hỏi của tôi : có bất kỳ công cụ ước tính thay thế nào tốt hơn, giả sử, lỗi tuyệt đối dự kiến ​​hoặc ý nghĩa lỗi bình phương dự kiến?t(3)


3
Chà, 1% của 100 là 1 vì vậy là định lượng theo kinh nghiệm 1%. tối thiểu{XTôi}
Tây An

@ Xi'an, đồng thời, không phải là điểm mà 1% dữ liệu có giá trị thấp hơn trong khi 99% dữ liệu có giá trị lớn hơn. Trên thực tế, 0% dữ liệu có giá trị thấp hơn theo thiết kế của công cụ ước tính này. Tôi tự hỏi nếu đó không phải là một vấn đề. (Trong ví dụ này, chúng ta có thể giả sử phân phối là liên tục). tối thiểu(x)
Richard Hardy

1
Mặt khác, ước tính lượng tử 1% dựa trên 100 quan sát đang yêu cầu một chút quá nhiều từ dữ liệu.
Tây An

1
"Tốt" theo nghĩa nào? Hàm mất mát của bạn là gì và mô hình xác suất cơ bản của bạn là gì?
whuber

2
Tối thiểu có thể là một công cụ ước tính cực kỳ tốt, chẳng hạn như khi các bản phân phối có giới hạn dưới hữu hạn. Khi đuôi bên trái có thể nặng, mức tối thiểu có thể có phương sai cực lớn và do đó là một công cụ ước tính kém. Đối xứng không thành vấn đề, bởi vì sự phân phối tối thiểu sẽ không bị ảnh hưởng đáng kể bởi phần đuôi trên. Đối với các vấn đề tham số, đặc biệt là trong các gia đình có quy mô địa điểm, câu trả lời của Aksakal gợi ý về cách xây dựng các công cụ ước tính tốt hơn của phân vị. Chúng thường được gọi là khoảng dung sai. Đối với các vấn đề không theo tỷ lệ, tất cả phụ thuộc.
whuber

Câu trả lời:


4

Tối thiểu 100 mẫu quan sát được sử dụng như một công cụ ước tính của lượng tử 1% trong thực tế. Tôi đã thấy nó được gọi là "phân vị theo kinh nghiệm."

Gia đình phân phối được biết đến

Nếu bạn muốn có một ước tính khác VÀ có ý tưởng về việc phân phối dữ liệu, thì tôi khuyên bạn nên xem xét trung bình thống kê đơn hàng. Ví dụ, gói R này sử dụng chúng cho các hệ số tương quan biểu đồ xác suất PPCC . Bạn có thể tìm thấy cách họ làm điều đó cho một số phân phối như bình thường. Bạn có thể xem thêm chi tiết trong bài báo năm 1986 của Vogel "Thử nghiệm hệ số tương quan âm mưu xác suất cho Hypothese phân phối bình thường, lognatural và Gumbel" ở đây theo thứ tự thống kê trung bình trên các phân phối bình thường và logic.

Chẳng hạn, từ bài báo Eq.2 của Vogel xác định min (x) của 100 mẫu quan sát từ phân phối chuẩn thông thường như sau: trong đó ước tính của trung vị của CDF:

M1= =Φ-1(FY(tối thiểu(y)))
F^Y(tối thiểu(y))= =1-(1/2)1/100= =0,0069

Chúng tôi nhận được giá trị sau: cho tiêu chuẩn thông thường mà bạn có thể áp dụng vị trí và tỷ lệ để có được ước tính tỷ lệ phần trăm thứ 1 của mình: .M1= =-2,46μ^-2,46σ^

Đây là cách so sánh với min (x) trên phân phối bình thường:

nhập mô tả hình ảnh ở đây

Biểu đồ trên cùng là phân phối công cụ ước tính min (x) của phân vị thứ 1 và phần dưới cùng là phần tôi đề nghị xem xét. Tôi cũng đã dán mã dưới đây. Trong mã tôi chọn ngẫu nhiên trung bình và độ phân tán của phân phối chuẩn, sau đó tạo một mẫu có độ dài 100 quan sát. Tiếp theo, tôi tìm min (x), sau đó chia tỷ lệ thành chuẩn bình thường bằng cách sử dụng các tham số thực của phân phối chuẩn. Đối với phương pháp M1, tôi tính toán lượng tử bằng cách sử dụng giá trị trung bình và phương sai ước tính, sau đó thu nhỏ nó trở lại tiêu chuẩn bằng cách sử dụng lại các tham số thực . Bằng cách này, tôi có thể tính đến tác động của sai số ước tính của giá trị trung bình và độ lệch chuẩn ở một mức độ nào đó. Tôi cũng hiển thị phần trăm thực sự với một đường thẳng đứng.

Bạn có thể thấy công cụ ước tính M1 chặt hơn nhiều so với min (x). Đó là bởi vì chúng tôi sử dụng kiến ​​thức của chúng tôi về loại phân phối thực sự , tức là bình thường. Chúng tôi vẫn không biết các thông số thực sự, nhưng ngay cả khi biết gia đình phân phối đã cải thiện đáng kể ước tính của chúng tôi.

MÃ THÁNG 10

Bạn có thể chạy nó ở đây trực tuyến: https://octave-online.net/

N=100000
n=100

mus = randn(1,N);
sigmas = abs(randn(1,N));
r = randn(n,N).*repmat(sigmas,n,1)+repmat(mus,n,1);
muhats = mean(r);
sigmahats = std(r);

fhat = 1-(1/2)^(1/100)
M1 = norminv(fhat)
onepcthats = (M1*sigmahats + muhats - mus) ./ sigmas;

mins = min(r);
minonepcthats = (mins - mus) ./ sigmas;

onepct = norminv(0.01)

figure
subplot(2,1,1)
hist(minonepcthats,100)
title 'min(x)'
xlims = xlim;
ylims = ylim;
hold on
plot([onepct,onepct],ylims)

subplot(2,1,2)
hist(onepcthats,100)
title 'M1'
xlim(xlims)
hold on
plot([onepct,onepct],ylims)

Phân phối không xác định

Nếu bạn không phân phối dữ liệu sắp tới, thì sẽ có một cách tiếp cận khác được sử dụng trong các ứng dụng rủi ro tài chính . Có hai bản phân phối Johnson SU và SL. Cái trước là cho các trường hợp không bị ràng buộc như Bình thường và Sinh viên t, và cái sau là cho các giới hạn thấp hơn như lognatural. Bạn có thể phù hợp với phân phối Johnson để dữ liệu của bạn, sau đó sử dụng các thông số ước tính ước tính quantile yêu cầu. Tuenter (2001) đã đề xuất một quy trình phù hợp với thời điểm, được sử dụng trong thực tế bởi một số người.

Nó sẽ tốt hơn min (x) chứ? Tôi không biết chắc chắn, nhưng đôi khi nó mang lại kết quả tốt hơn trong thực tiễn của tôi, ví dụ như khi bạn không biết phân phối nhưng biết rằng nó bị giới hạn thấp hơn.


1
@RichardHardy, tôi đã thêm một bản demo để hiển thị những gì tôi đang đề xuất và cách nó cải thiện khi min (x). Không, Vogel thậm chí không nói về min (x). Đó là ứng dụng của tôi về phương pháp trung bình cho trường hợp của bạn. PPCC sử dụng các lượng tử từ 1 đến n'th trong mẫu. Trong 100 mẫu quan sát tối thiểu (x) là phân vị thứ 1.
Aksakal

Cảm ơn các cập nhật! Điều tôi đã hỏi là bài báo Eq.2 của Vogel định nghĩa mẫu tối thiểu (x) của 100 mẫu quan sát : có nên có thay vì min (x) không? Vì thực tế, min (x) đang được định nghĩa lại là một cái gì đó khác với min (x) theo nghĩa đen, đó là ấn tượng của tôi. M1
Richard Hardy

@RichardHardy, họ sắp xếp lại các quan sát, vì vậy M1 sẽ là tối thiểu (x)
Aksakal
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.