Trực giác đằng sau hàm mật độ phân phối t


12

Tôi đang nghiên cứu về phân phối t của Sinh viên và tôi bắt đầu tự hỏi, làm thế nào một người có được hàm mật độ phân phối t (từ wikipedia, http://en.wikipedia.org/wiki/Student%27s_t-distribution ):

f(t)=Γ(v+12)vπΓ(v2)(1+t2v)v+12

nơi là bậc tự do và Γ là hàm gamma. Trực giác của chức năng này là gì? Ý tôi là, nếu tôi nhìn vào hàm khối lượng xác suất của phân phối nhị thức, nó có ý nghĩa với tôi. Nhưng chức năng mật độ phân phối t không có ý nghĩa gì đối với tôi ... nó hoàn toàn không trực quan ngay từ cái nhìn đầu tiên. Hay là trực giác chỉ là nó có đường cong hình chuông và nó phục vụ nhu cầu của chúng ta?vΓ

Thnx cho bất kỳ trợ giúp :)


3
Phân phối này có một giải thích hình học đơn giản (và đẹp). Thật vậy, mặc dù Sinh viên (1908) lần đầu tiên nhận được dạng PDF này thông qua một phỏng đoán thông minh (được hỗ trợ bởi mô phỏng Monte-Carlo), nhưng lần đầu tiên, Fisher (c. 1920) đã thu được nó bằng một đối số hình học. Điều cốt lõi là mô tả phân bố tỷ lệ chiều cao của một (điểm phân bố đồng đều) trên ν + 1bán kính của nó (khoảng cách từ trục): nói cách khác, tiếp tuyến của vĩ độ của nó. Một tài khoản này được cung cấp tại evolvemiccoat.com/Literature/GeometricTDistribution.pdf . fν+1
whuber

Câu trả lời:


8

Nếu bạn có một biến ngẫu nhiên tiêu chuẩn bình thường, và một biến ngẫu nhiên chi bình phương độc lập Q với ν df, thìZQν

T= =Z/Q/ν

có phân phối với ν df. (Tôi không chắc Z / Q được phân phối là gì, nhưng nó không phải là t .)tνZ/Qt

Đạo hàm thực tế là một kết quả khá chuẩn. Alecos làm điều đó một vài cách ở đây .

Theo như trực giác, tôi không có trực giác cụ thể cho hình thức chức năng cụ thể, nhưng một số ý nghĩa chung về hình dạng có thể thu được bằng cách xem xét rằng (tỷ lệ theo ) phân phối chi độc lập trên mẫu số là sai lệch:ν

nhập mô tả hình ảnh ở đây

Chế độ hơi dưới 1 (nhưng gần hơn 1 khi df tăng), với một số cơ hội giá trị đáng kể ở trên và dưới 1. Sự thay đổi trong phương tiện mà phương sai củatsẽ lớn hơn so vớiZ. Các giá trị củaQ/νtZQ/νtZtZ là.

tQ/νt

nhập mô tả hình ảnh ở đây

('tương đối nhiều đỉnh hơn' dẫn đến một đỉnh sắc nét hơn một chút so với mức chênh lệch, nhưng phương sai lớn hơn kéo tâm xuống, điều đó có nghĩa là đỉnh thấp hơn một chút với df thấp hơn)

t


1
Tôi đã hơi cẩu thả trong lời giải thích của tôi. Tất nhiên đó là căn bậc hai của biến ngẫu nhiên phân phối Chi-vuông chia cho mức độ tự do của nó.
Nhà phân tích

@Analyst Tôi đã làm điều tương tự, hơn một lần.
Glen_b -Reinstate Monica

8

Câu trả lời của Glen là đúng, nhưng theo quan điểm của Bayes, cũng rất hữu ích khi nghĩ về phân phối t là một hỗn hợp liên tục của các phân phối bình thường với các phương sai khác nhau. Bạn có thể tìm thấy đạo hàm ở đây:

Sinh viên t là hỗn hợp của gaussian

Tôi cảm thấy rằng phương pháp này giúp ích cho trực giác của bạn vì nó làm rõ cách phân phối t phát sinh khi bạn không biết chính xác sự thay đổi của dân số.


1
Tôi đã tạo một hình ảnh động của bản phân phối t dưới dạng hỗn hợp các bản phân phối bình thường ở đây: sumsar.net/blog/2013/12/t-as-a-mixture-of-normals
Rasmus Bååth
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.