phân phối t có đuôi nặng hơn phân phối bình thường


10

Trong bài giảng của tôi ghi chú, nó nói,

phân bố t trông như bình thường, mặc dù có đuôi hơi nặng.

Tôi hiểu tại sao nó trông bình thường (vì Định lý giới hạn trung tâm). Nhưng tôi gặp khó khăn trong việc hiểu làm thế nào để chứng minh một cách toán học rằng nó có đuôi nặng hơn phân phối bình thường và nếu có cách nào để đo đến mức nào thì nó nặng hơn phân phối bình thường.

Câu trả lời:


12

Điều đầu tiên cần làm là chính thức hóa những gì chúng ta muốn nói là "cái đuôi nặng hơn". Người ta có thể nhìn vào mật độ cao ở đuôi cực cao sau khi chuẩn hóa cả hai phân phối để có cùng vị trí và tỷ lệ (ví dụ độ lệch chuẩn):

nhập mô tả hình ảnh ở đây
(từ câu trả lời này, cũng có phần liên quan đến câu hỏi của bạn )

[Trong trường hợp này, tỷ lệ không thực sự quan trọng cuối cùng; t vẫn sẽ "nặng" hơn bình thường ngay cả khi bạn sử dụng các thang đo rất khác nhau; bình thường luôn luôn đi thấp hơn cuối cùng]

Tuy nhiên, định nghĩa đó - trong khi nó hoạt động tốt đối với sự so sánh cụ thể này - không khái quát hóa tốt lắm.

Tổng quát hơn, một định nghĩa tốt hơn nhiều là trong câu trả lời của whuber ở đây . Vì vậy, nếu có đuôi nặng hơn , vì trở nên đủ lớn (với tất cả một số ), thì , trong đó , trong đó là cdf (đối với nặng hơn - bên phải, có một định nghĩa tương tự, rõ ràng ở phía bên kia).X t t > t 0 S Y ( t ) > S X ( t ) S = 1 - F FYXtt>t0SY(t)>SX(t)S=1FF

nhập mô tả hình ảnh ở đây

Đây là thang đo log và thang đo lượng tử của bình thường, cho phép chúng ta xem chi tiết hơn:

nhập mô tả hình ảnh ở đây

Vì vậy, "bằng chứng" của đuôi nặng hơn sẽ liên quan đến việc so sánh các cdf và cho thấy phần đuôi trên của t-cdf cuối cùng luôn nằm trên phần đuôi bình thường và phần dưới của t-cdf cuối cùng luôn nằm dưới mức bình thường.

Trong trường hợp này, điều dễ làm là so sánh mật độ và sau đó chỉ ra rằng vị trí tương đối tương ứng của các cdf (/ hàm sống sót) phải tuân theo đó.

Vì vậy, ví dụ nếu bạn có thể lập luận rằng (tại một số )ν

x2(ν+1)log(1+x2ν)>2log(k)

đối với hằng số cần thiết (một hàm của ), với tất cả một số , thì có thể thiết lập một đuôi nặng hơn cho theo định nghĩa về lớn hơn (hoặc lớn hơn trên đuôi trái).ν x > x 0 t ν 1 - F Fkνx>x0tν1FF

(hình thức này xuất phát từ sự khác biệt của nhật ký mật độ, nếu điều đó giữ mối quan hệ cần thiết giữa mật độ giữ)

[Thực sự có thể hiển thị nó cho bất kỳ nào (không chỉ là một cụ thể mà chúng ta cần đến từ các hằng số chuẩn hóa mật độ có liên quan), vì vậy kết quả phải giữ cho chúng ta cần.]kkk


1
Một biểu đồ với (và có thể kéo dài một chút) có thể chứng minh các đuôi nặng hơn rõ ràng hơn và cũng có thể hoạt động với mức độ tự do cao hơn,xlogS(x)x
Henry

1
@Henry Tôi đã tạo ra một cốt truyện như vậy nhưng không chắc nó đã thêm bao nhiêu giá trị nên tôi không bao gồm nó. Tôi sẽ suy nghĩ về việc đưa nó vào.
Glen_b -Reinstate Monica

1
@Henry Mình tính cả cốt truyện.
Glen_b -Reinstate Monica

2

E{xn}.

Các đuôi "nặng hơn" sẽ có nghĩa là các giá trị cao hơn cho các khoảnh khắc sức mạnh chẵn (power 4, 6, 8), khi phương sai là như nhau. Cụ thể, khoảnh khắc thứ 4 (khoảng 0) được gọi là kurtosis và so sánh theo một cách chính xác nào đó về độ nặng của đuôi.

Xem Wikipedia để biết chi tiết ( https://en.wikipedia.org/wiki/Kurtosis )


1
t34214

3
t(ν)+xνννtν

2

Dưới đây là một bằng chứng chính thức dựa trên các chức năng sinh tồn. Tôi sử dụng định nghĩa sau đây về "đuôi nặng hơn" lấy cảm hứng từ wikipedia :

YSy(t)XSx(t)

limtSy(t)Sx(t)=

Xét một biến ngẫu nhiên phân phối là t của Sinh viên với giá trị trung bình bằng 0, bậc tự do và tham số tỷ lệ . Chúng tôi so sánh điều này với biến ngẫu nhiên . Đối với cả hai biến, các hàm sinh tồn là khác nhau. Vì thế, YνaXN(0,σ2)u=t2/một20<một2/σ2<limu

limtSy(t)Sx(t)=limtfy(t)fx(t)=explimt(logfy(t)logfx(t))=explimt(ν+12log(1+t2νa2)(12σ2t2)+C)=exp(limtν+12log(1+t2νa2)(12σ2t2)+C)=exp(limt12σ2t2ν+12log(1+t2νa2)+C)=exp(12limua2σ2u(ν+1)log(1+uν)+C)=exp(12limuu(a2σ2(ν+1)log(1+uν)u+Cu))
Trường hợp chúng tôi đã thay thế . Lưu ý rằng là hằng số, và Do đó theo định lý giới hạn đại số, u=t2/a20<a2/σ2<limuC/u=0limtSy(t)
limu(ν+1)log(1+uν)u=limu(ν+1)(1)(1+uν)(ν)=0
limtSy(t)Sx(t)=exp(12limuu(a2σ2(0)+(0)))=

Điều quan trọng, kết quả giữ các giá trị tùy ý (hữu hạn) của , và , do đó bạn có thể gặp tình huống khi phân phối có phương sai nhỏ hơn bình thường, nhưng vẫn có đuôi nặng hơn.σ 2 νaσ2ν


1
Chỉ cần lưu ý rằng "định nghĩa" về đuôi nặng hơn không phải lúc nào cũng được chấp nhận. Ví dụ: phân phối N (0,1), theo định nghĩa này, có đuôi nặng hơn phân phối 0,9999 * U (-1,1) + .0001 * U (-1000, 1000), mặc dù phân phối sau tạo ra giá trị không thường xuyên lên tới 175 độ lệch chuẩn so với giá trị trung bình, mặc dù có hỗ trợ giới hạn. Tất nhiên, N (0,1) cũng tạo ra các giá trị như vậy, nhưng với xác suất thấp hơn những gì có thể được coi là phù hợp cho các mục đích thực tế.
Peter Westfall
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.