Tại sao phân phối t trở nên bình thường hơn khi kích thước mẫu tăng?


19

Theo Wikipedia, tôi hiểu rằng phân phối t là phân phối lấy mẫu của giá trị t khi các mẫu là các quan sát iid từ một quần thể phân phối bình thường. Tuy nhiên, tôi không hiểu một cách trực giác tại sao điều đó khiến hình dạng của phân bố t thay đổi từ đuôi béo thành gần như hoàn toàn bình thường.

Tôi hiểu rằng nếu bạn lấy mẫu từ một phân phối bình thường thì nếu bạn lấy một mẫu lớn, nó sẽ giống với phân phối đó, nhưng tôi không hiểu tại sao nó bắt đầu với hình dạng đuôi béo.

Câu trả lời:


22

Tôi sẽ cố gắng đưa ra một lời giải thích trực quan.

Thống kê t * có tử số và mẫu số. Ví dụ: thống kê trong một bài kiểm tra mẫu là

x¯μ0s/n

* (có một số, nhưng hy vọng cuộc thảo luận này đủ chung chung để bao quát những vấn đề bạn đang hỏi về)

Theo các giả định, tử số có phân phối chuẩn với trung bình 0 và một số độ lệch chuẩn không xác định.

Trong cùng một nhóm các giả định, mẫu số là ước tính độ lệch chuẩn của phân bố tử số (sai số chuẩn của thống kê trên tử số). Nó là độc lập với tử số. Bình phương của nó là một biến ngẫu nhiên chi bình phương chia cho mức độ tự do của nó (cũng là df của phân phối t) lần .σnumerator

Khi mức độ tự do nhỏ, mẫu số có xu hướng khá lệch phải. Nó có khả năng cao là ít hơn so với ý nghĩa của nó, và cơ hội tương đối tốt là khá nhỏ. Đồng thời, nó cũng có một số cơ hội lớn hơn nhiều so với ý nghĩa của nó.

Theo giả định về tính quy tắc, tử số và mẫu số là độc lập. Vì vậy, nếu chúng ta rút ngẫu nhiên từ phân phối của thống kê t này, chúng ta có một số ngẫu nhiên bình thường chia cho giá trị ngẫu nhiên thứ hai * được chọn từ phân phối lệch phải trung bình khoảng 1.

* không liên quan đến thuật ngữ bình thường

Bởi vì nó nằm trên mẫu số, các giá trị nhỏ trong phân phối mẫu số tạo ra các giá trị t rất lớn. Các xiên phải trong mẫu số làm cho thống kê t nặng đuôi. Đuôi bên phải của phân phối, khi trên mẫu số làm cho phân phối t đạt cực đại mạnh hơn so với bình thường với độ lệch chuẩn tương tự như t .

Tuy nhiên, khi mức độ tự do trở nên lớn, sự phân phối trở nên trông bình thường hơn và "chặt chẽ" hơn nhiều so với ý nghĩa của nó.

nhập mô tả hình ảnh ở đây

Như vậy, ảnh hưởng của việc chia theo mẫu số đối với hình dạng phân bố tử số giảm khi mức độ tự do tăng.

Cuối cùng - như định lý của Slutsky có thể gợi ý cho chúng ta có thể xảy ra - hiệu ứng của mẫu số trở nên giống như chia cho một hằng số và sự phân bố của thống kê t rất gần với bình thường.


Được xem xét về mặt đối ứng của mẫu số

whuber đề xuất trong các ý kiến ​​rằng nó có thể được chiếu sáng hơn để xem xét đối ứng của mẫu số. Đó là, chúng ta có thể viết số liệu thống kê t của mình dưới dạng tử số (bình thường) lần đối ứng của mẫu số (lệch phải).

Ví dụ: thống kê một mẫu của chúng tôi ở trên sẽ trở thành:

n(x¯μ0)1/s

Bây giờ hãy xem xét độ lệch chuẩn dân số của ban đầu , . Chúng ta có thể nhân và chia cho nó, như vậy:Xiσx

n(x¯μ0)/σxσx/s

Thuật ngữ đầu tiên là tiêu chuẩn bình thường. Thuật ngữ thứ hai (căn bậc hai của biến ngẫu nhiên nghịch đảo bình phương tỷ lệ) sau đó chia tỷ lệ tiêu chuẩn bình thường theo các giá trị lớn hơn hoặc nhỏ hơn 1, "trải rộng ra".

Theo giả định về tính quy tắc, hai thuật ngữ trong sản phẩm là độc lập. Vì vậy, nếu chúng tôi rút ngẫu nhiên từ phân phối thống kê t này, chúng tôi có một số ngẫu nhiên bình thường (thuật ngữ đầu tiên trong sản phẩm) nhân với giá trị được chọn ngẫu nhiên thứ hai (không liên quan đến thuật ngữ thông thường) từ phân phối lệch phải ' thường là 'khoảng 1.

Khi df lớn, giá trị có xu hướng rất gần với 1, nhưng khi df nhỏ, nó khá lệch và độ lan rộng lớn, với đuôi phải lớn của hệ số tỷ lệ này làm cho đuôi khá mập:

nhập mô tả hình ảnh ở đây


Cảm ơn! Điều này đã làm rõ nhiều, nhưng tôi vẫn không chắc chắn về "Bình phương của nó là một biến ngẫu nhiên chi bình phương chia cho mức độ tự do của nó (cũng là df của phân bố t) lần [độ lệch chuẩn của tử số] ". Bạn đã đề cập rằng chỉ vì nó là một điều hữu ích để biết, hoặc nó là một cái gì đó liên quan trực tiếp đến câu trả lời cho câu hỏi của tôi? Tôi hiểu rằng đó là phân phối của mẫu số, trái ngược với phân phối bình phương của mẫu số, được mô tả trong hình của bạn.
user1205901 - Tái lập lại

2
Sự phân phối của thống kê sẽ có đuôi nặng hơn bình thường ngay cả khi nó không cụ thể là căn bậc hai của một hình vuông chi trên df của nó; theo nghĩa đó, nó sẽ không trực tiếp thay đổi câu trả lời. Nhưng ít nhất nó phục vụ như là một lời giải thích cho việc phân phối tỷ lệ trong sơ đồ đến từ đâu.
Glen_b -Reinstate Monica

3
Tôi nghĩ rằng có thể sẽ sáng sủa hơn một chút khi tiến hành phân tích này dựa trên sự đối ứng của độ lệch chuẩn mẫu. Điều đó, cùng với một lập luận rằng SD mẫu độc lập với giá trị trung bình của mẫu (một ý tưởng chính sẽ có lợi từ sự nhấn mạnh và giải thích hơn một chút, IMHO), sẽ giúp mọi người thấy rằng việc phân chia mẫu có nghĩa là SD mẫu phải trải ra những gì nếu không sẽ là một phân phối bình thường. (Tất nhiên đây là toàn bộ điểm khám phá của Gossett.)
whuber

1
@whuber Tôi đã thêm một phần thảo luận về khía cạnh đối ứng, nhưng cũng giữ lại cuộc thảo luận ban đầu (có vẻ như tôi trực tiếp hơn, nhưng tôi đánh giá cao rằng nhiều người có thể hiểu rõ hơn về mặt đối ứng) . Tôi cũng sẽ thêm một chút về sự độc lập
Glen_b -Reinstate Monica

1
Giá trị của mẫu số trong thống kê t ( ) trung bình gần với . Thứ xấp xỉ 1 (ít nhất là trong các mẫu lớn hơn) là - mà chúng ta thấy trong âm mưu đầu tiên - và tương ứng là (trong âm mưu thứ hai). Hy vọng rằng rõ ràng lý do tại sao những thứ đó gần bằng 1 khi mẫu đủ lớn để đưa ra ước tính hợp lý về . s/n s/σσ/sσσ/ns/σσ/sσ
Glen_b -Reinstate Monica

8

@Glen_b đã cho bạn trực giác về lý do tại sao thống kê t trông bình thường hơn khi kích thước mẫu tăng. Bây giờ, tôi sẽ cung cấp cho bạn một lời giải thích kỹ thuật hơn một chút cho trường hợp khi bạn đã có sự phân phối của thống kê.

n1n

(1+x2n1)n/2n1B(n12,12).

Có thể chỉ ra rằng

1n1B(n12,12)12π,

(1+x2n1)n/2exp(x2/2),

n


2
1/n(1+(x/n)2)1tnbậc tự do? Nó muốn biết lý do tại sao chuỗi "bắt đầu với hình dạng đuôi béo mà nó làm."
whuber

2
nn

2

Tôi chỉ muốn chia sẻ điều gì đó giúp trực giác của tôi khi mới bắt đầu (mặc dù nó ít nghiêm ngặt hơn các câu trả lời khác).

Z,Z1,...,Zn

ZZ12+...+Zn2n

n

n1Zn

E[Z2]= =1nZTôi2nZTôi2

nZ1= =Z

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.