Tại sao kurtosis dương tính cao có vấn đề cho các xét nghiệm giả thuyết?


13

Tôi đã nghe (xin lỗi không thể cung cấp một liên kết đến một văn bản, điều mà tôi đã nói) rằng sự suy yếu tích cực cao của phần dư có thể là vấn đề đối với các bài kiểm tra giả thuyết chính xác và khoảng tin cậy (và do đó có vấn đề với suy luận thống kê). Điều này có đúng không và nếu có thì tại sao? Liệu một sự suy yếu tích cực cao của phần dư sẽ không chỉ ra rằng phần lớn các phần dư nằm gần giá trị trung bình còn lại của 0 và do đó phần dư nhỏ hơn có mặt? (Nếu bạn có câu trả lời, vui lòng thử đưa ra câu trả lời với toán học không sâu sắc vì tôi không thiên về toán học cao).


4
Tôi đoán rằng bạn đang tập trung vào các mô hình với các điều kiện lý tưởng của các thuật ngữ lỗi thông thường (Gaussian). (Trong nhiều bối cảnh khác, có thể dự kiến ​​mức độ tổn thương cao của phần dư. Ngay cả khi có nhiều gần 0, đó chỉ là tin tốt, và đó là tin xấu có thể cần được chú ý. Nhưng điều đó có thể có nghĩa là bất cứ điều gì. Một âm mưu còn lại so với trang bị thường là nhiều thông tin hơn.
Nick Cox

Thật vậy, tôi đã tập trung vào các mô hình với các giả định thông thường.
DDK

Câu trả lời:


15

nghe nói [...] rằng một sự suy yếu tích cực cao của phần dư có thể là vấn đề đối với các bài kiểm tra giả thuyết chính xác và khoảng tin cậy (và do đó có vấn đề với suy luận thống kê). Điều này có đúng không và nếu có thì tại sao?

Đối với một số loại kiểm tra giả thuyết, đó là sự thật.

Liệu một sự suy yếu tích cực cao của phần dư sẽ không chỉ ra rằng phần lớn các phần dư nằm gần giá trị trung bình còn lại của 0 và do đó phần dư nhỏ hơn có mặt?

Không.

Có vẻ như bạn đang nhầm lẫn giữa khái niệm phương sai với suy nghĩ. Nếu phương sai nhỏ hơn, thì xu hướng phần dư nhỏ hơn và phần dư lớn hơn sẽ kết hợp với nhau. Hãy tưởng tượng chúng ta giữ hằng số độ lệch chuẩn trong khi chúng ta thay đổi mức độ tổn thương (vì vậy chúng ta chắc chắn đang nói về những thay đổi đối với kurtosis hơn là phương sai).

So sánh các phương sai khác nhau (nhưng cùng một kurtosis):

nhập mô tả hình ảnh ở đây

với kurtosis khác nhau nhưng cùng một phương sai:

nhập mô tả hình ảnh ở đây

(hình ảnh từ bài đăng này )

Kurtosis cao trong nhiều trường hợp liên quan đến độ lệch nhỏ hơn trung bình - số dư nhỏ hơn mức bạn tìm thấy với phân phối bình thường .. nhưng để giữ độ lệch chuẩn ở cùng giá trị, chúng ta cũng phải có số dư lớn hơn (bởi vì có nhiều phần dư nhỏ hơn sẽ làm cho khoảng cách điển hình từ giá trị trung bình nhỏ hơn). Để có được nhiều hơn cả phần dư lớn và phần dư nhỏ, bạn sẽ có phần dư "kích thước điển hình" ít hơn - những phần còn lại có độ lệch chuẩn so với giá trị trung bình.

nó phụ thuộc vào cách bạn định nghĩa "nhỏ bé"; bạn không thể chỉ cần thêm rất nhiều dư lớn và liên tục giữ đúng, bạn cần một cái gì đó để bù đắp cho nó - nhưng đối với một sốchosố đo "nhỏ" bạn có thể tìm cách để tăng nhọn mà không tăng mà biện pháp cụ thể. (Ví dụ: kurtosis cao hơn không tự động ngụ ý một đỉnh cao hơn như vậy)

Kurtosis cao hơn có xu hướng đi với số dư lớn hơn, ngay cả khi bạn giữ hằng số phương sai.

[Hơn nữa, trong một số trường hợp, nồng độ của phần dư nhỏ thực sự có thể dẫn đến nhiều vấn đề hơn so với phần bổ sung của phần dư lớn nhất - tùy thuộc vào những gì bạn đang xem.]

Dù sao, hãy nhìn vào một ví dụ. Xem xét thử nghiệm t một mẫu và cỡ mẫu là 10.

Nếu chúng ta bác bỏ giả thuyết null khi giá trị tuyệt đối của thống kê t lớn hơn 2,262, thì khi các quan sát là độc lập, phân phối chính xác từ phân phối bình thường và trung bình giả thuyết là trung bình dân số thực, chúng ta sẽ từ chối null giả thuyết 5% thời gian.

Hãy xem xét một phân phối cụ thể với mức độ tổn thương cao hơn đáng kể so với bình thường: 75% dân số của chúng ta có các giá trị được rút ra từ một phân phối bình thường và 25% còn lại có các giá trị được rút ra từ một phân phối bình thường với độ lệch chuẩn lớn gấp 50 lần.

Nếu tôi tính toán chính xác, điều này tương ứng với mức độ tổn thương là 12 (mức độ tổn thương quá mức là 9). Phân phối kết quả là đỉnh cao hơn nhiều so với bình thường và có đuôi nặng. Mật độ được so sánh với mật độ bình thường bên dưới - bạn có thể thấy đỉnh cao hơn, nhưng bạn thực sự không thể thấy phần đuôi nặng hơn trong hình ảnh bên trái, vì vậy tôi cũng vẽ sơ đồ logarit của mật độ, kéo dài phần dưới của hình ảnh và nén đỉnh, giúp dễ dàng nhìn thấy cả đỉnh và đuôi.

nhập mô tả hình ảnh ở đây

n=10

(Bạn cũng sẽ thấy ảnh hưởng đáng kể đến phạm vi bảo hiểm của khoảng tin cậy.)

Lưu ý rằng một phân phối khác nhau có cùng mức độ tổn thương sẽ có tác động khác nhau đến mức ý nghĩa.


Vậy tại sao tỷ lệ từ chối đi xuống? Đó là bởi vì đuôi nặng hơn dẫn đến một số ngoại lệ lớn, có tác động lớn hơn một chút đến độ lệch chuẩn so với trung bình; điều này tác động đến thống kê t vì nó dẫn đến nhiều giá trị t giữa -1 và 1, trong quá trình giảm tỷ lệ giá trị trong khu vực quan trọng.

H0

Tôi se cho bạn xem. Đây là một mẫu có kích thước 10:

 1.13 1.68 2.02 2.30 2.56 2.80 3.06 3.34 3.68 4.23

H0:μ=2

Bây giờ làm cho giá trị lớn nhất 50:

      1.13 1.68 2.02 2.30 2.56 2.80 3.06 3.34 3.68 50

Rõ ràng chúng ta kéo giá trị trung bình lên, vì vậy nó sẽ chỉ ra một sự khác biệt thậm chí nhiều hơn so với trước đây, phải không? Chà, không, không. Thống kê t đi xuống . Bây giờ là 1.106 và giá trị p khá lớn (gần 30%). Chuyện gì đã xảy ra? Chà, chúng tôi đã kéo giá trị trung bình lên (tới 7.257), nhưng độ lệch chuẩn tăng lên hơn 15.

Độ lệch chuẩn nhạy hơn một chút so với các ngoại lệ so với phương tiện - khi bạn đặt ngoại lệ, bạn có xu hướng đẩy thống kê t một mẫu về 1 hoặc -1.

Nếu có cơ hội có nhiều ngoại lệ, thì điều tương tự chỉ xảy ra đôi khi chúng có thể ở hai phía đối diện (trong trường hợp độ lệch chuẩn thậm chí còn tăng cao hơn trong khi tác động lên giá trị trung bình giảm so với một ngoại lệ), do đó, thống kê t có xu hướng di chuyển đến gần 0.

Các công cụ tương tự diễn ra với một số thử nghiệm phổ biến khác giả định tính bình thường - mức độ tổn thương cao hơn có xu hướng liên quan đến đuôi nặng hơn, có nghĩa là nhiều ngoại lệ hơn, có nghĩa là độ lệch chuẩn bị thổi phồng so với phương tiện và do đó sự khác biệt bạn muốn nhận để bị "lầy" bởi tác động của các ngoại lệ trong bài kiểm tra. Đó là, năng lượng thấp.


1
Wow, cảm ơn rất nhiều vì câu trả lời rất rõ ràng và công phu. Thời gian của bạn được nhiều đánh giá cao!
DDK

Cũng cần lưu ý rằng, trong khi phân phối mẫu lớn của giá trị trung bình mẫu không phụ thuộc vào mức độ tổn thương (do đó, mức độ ý nghĩa thực tế của các phép thử giả định đối với phương tiện hội tụ đến mức danh nghĩa, điển hình là 0,05, như n-> vô cùng, đối với tất cả các kurtosis hữu hạn), điều tương tự là không đúng đối với các xét nghiệm về phương sai. Phân bố mẫu lớn của phương sai ước tính phụ thuộc vào mức độ tổn thương, do đó, mức độ ý nghĩa thực tế của các xét nghiệm giả định cổ điển, bình thường không hội tụ đến mức danh nghĩa là n -> vô cùng khi độ nhiễu khác 0.
Peter Westfall

Ngoài ra, kurtosis cao hơn không ngụ ý, về mặt toán học, có "độ lệch nhỏ hơn so với giá trị trung bình". Điều duy nhất nó nói với bạn chắc chắn là có nhiều hơn ở đuôi.
Peter Westfall

Bạn không thể có độ lệch lớn hơn và giữ hằng số phương sai trừ khi bạn cũng tạo ra độ lệch nhỏ hơn; nếu bạn không giữ phương sai không đổi, nhiều sai lệch của bạn sẽ trở nên nhỏ so với thang đo mới. Vì vậy, có, khi nói đến kurtosis, toán học nói với bạn rằng lớn hơn mang theo nó nhỏ hơn.
Glen_b -Reinstate Monica

ZXκ= =E(Z4)κ-1= =E(Z2)κZVar(Z)= =1Xμ±kσkXX'Z'

3

Kurtosis biện pháp ngoại lệ. Các ngoại lệ là vấn đề đối với các suy luận tiêu chuẩn (ví dụ: kiểm tra t, khoảng t) dựa trên phân phối chuẩn. Đó là kết thúc của câu chuyện! Và đó thực sự là một câu chuyện khá đơn giản.

Lý do câu chuyện này không được đánh giá cao là bởi vì truyền thuyết cổ xưa rằng các biện pháp kurtosis "đỉnh cao" vẫn tồn tại.

Dưới đây là một lời giải thích đơn giản cho thấy lý do tại sao kurtosis đo lường các ngoại lệ và không phải là "đỉnh điểm".

Hãy xem xét các tập dữ liệu sau đây.

0, 3, 4, 1, 2, 3, 0, 2, 1, 3, 2, 0, 2, 2, 3, 2, 5, 2, 3, 1

Kurtosis là giá trị mong đợi của (giá trị z) ^ 4. Dưới đây là (giá trị z) ^ 4:

6,51, 0,30, 5,33, 0,45, 0,00, 0,30, 6,51, 0,00, 0,45, 0,30, 0,00, 6,51, 0,00, 0,00, 0,30, 0,00, 27,90, 0,00, 0,30, 0,45

Trung bình là 2,78, và đó là ước tính của kurtosis. (Trừ 3 nếu bạn muốn kurtosis dư thừa.)

Bây giờ, thay thế giá trị dữ liệu cuối cùng bằng 999 để nó trở thành ngoại lệ:

0, 3, 4, 1, 2, 3, 0, 2, 1, 3, 2, 0, 2, 2, 3, 2, 5, 2, 3, 999

Bây giờ, đây là (giá trị z) ^ 4:

0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 360,98

Trung bình là 18,05, và đó là ước tính của kurtosis. (Trừ 3 nếu bạn muốn kurtosis dư thừa.)

Rõ ràng, chỉ có (các) ngoại lệ. Không có gì về "đỉnh" hoặc dữ liệu gần các vấn đề trung bình.

Nếu bạn thực hiện phân tích thống kê tiêu chuẩn với bộ dữ liệu thứ hai, bạn sẽ gặp rắc rối. Kurtosis lớn cảnh báo bạn về vấn đề.

Đây là một bài viết chi tiết:

Tây, PH (2014). Kurtosis như đỉnh cao, 1905 - 2014. RIP Nhà thống kê người Mỹ, 68, 191 Phản 195.


Tại sao không chỉ sử dụng các bài kiểm tra không tham số? Đối với những loại vấn đề này họ có khả năng là vượt trội.
Carl

1
Đồng ý, đó là một con đường khả thi, NẾU bạn thích thử nghiệm, điều này nhanh chóng trở nên ít thú vị hơn ở dạng cổ điển của nó. Nhưng đó không thực sự là mối quan tâm của tôi. Tôi quan tâm nhiều hơn đến mô hình xác suất nói chung. Một ứng dụng: Có thể bạn thực sự quan tâm đến giá trị trung bình, ví dụ, trong trường hợp biến phụ thuộc là đô la kiếm được, giá trị trung bình của quy trình thú vị hơn so với trung bình của quy trình. Vì vậy, dữ liệu cho bạn biết gì về quy trình có nghĩa là gì khi dữ liệu dễ bị lỗi thời? Đó là một vấn đề khó khăn, nhưng là một vấn đề quan trọng, và sự suy yếu thời điểm có liên quan đến câu trả lời. Không phải xét nghiệm nonpar.
Peter Westfall

Đối với phân phối Cauchy, giá trị trung bình cắt có thể là thước đo vị trí tốt hơn so với trung bình và giá trị trung bình thông thường sẽ không phải là thước đo vị trí. Việc sử dụng làm thước đo vị trí phụ thuộc vào phân phối là gì. Một ví dụ cho thấy kurtosis sẽ không hữu ích vì một chỉ số là phân phối đồng đều trong đó giá trị cực trị trung bình là thước đo vị trí tốt hơn cả trung bình và trung bình.
Carl

Không phải là vấn đề. Nếu bạn quan tâm đến tổng số, ví dụ: đô la, thì giá trị trung bình thông thường là thước đo vị trí bạn muốn.
Peter Westfall

Nếu bạn có một biến phân phối Cauchy, bạn có thể tạo ra một trường hợp cho tổng số đô la kiếm được, nhưng giá trị trung bình sẽ không phải là thước đo vị trí đặc biệt hữu ích có nghĩa là "giá trị mong đợi" không có kỳ vọng hợp lý liên quan đến nó.
Carl

-3

Kurtosis cũng chỉ ra đuôi không đối xứng. Trong một thử nghiệm giả thuyết hai đuôi, một cái đuôi sẽ là một cái đuôi dài, và cái còn lại sẽ là một cái đuôi ngắn. Một trong những cái đuôi có thể là> alpha, nhưng <beta. Một đuôi sẽ vượt qua giá trị p, nhưng đuôi kia thì không.

Về cơ bản, suy luận thống kê giả định một tiêu chuẩn bình thường. Khi nó không phải là một tiêu chuẩn thông thường, bạn có thể nhận được bằng một suy luận dựa trên một số cơ chế suy luận phức tạp hơn. Bạn có thể sử dụng suy luận Poisson, nhưng với phân phối không bình thường, bạn không thể sử dụng suy luận dựa trên quy tắc.

Skew và kurtosis là một thước đo của sự không bình thường. Chúng tôi học cách sử dụng các phương tiện và sử dụng các phân phối bình thường trước khi chúng tôi biết rằng chúng tôi phải kiểm tra tính bình thường. Một bình thường đòi hỏi 36 điểm dữ liệu trở lên từ mỗi chiều. Bạn có thể ước tính ở 20 điểm dữ liệu, nhưng bạn vẫn sẽ bị lệch và kurtosis. Khi phân phối tiếp cận tính quy tắc, độ lệch và phân phối biến mất.

Một trong những lời giải thích định nghĩa kurtosis là đỉnh điểm. Một người khác thì không. Đây là một cuộc chiến bất ổn vào lúc này. Kurtosis là khoảnh khắc thứ tư, một khu vực. Tôi không phải là đỉnh điểm của vấn đề.

Một ý tưởng khác được đưa ra là với một độ lệch, trung tuyến nghiêng về chế độ tạo thành một hình tam giác. Thưởng thức.


1
Không rõ ràng rằng điều này thêm bất cứ điều gì hữu ích và khác với câu trả lời đã xuất sắc. Nó không thêm một số câu khó hiểu, ví dụ: "bình thường cần 36 điểm dữ liệu trở lên" (vì vậy 35 không ổn? Cơ sở cho tuyên bố này là gì? "Sự sai lệch như là đỉnh điểm" Tôi không nghĩ có ai tuyên bố điều này. " tiêu chuẩn bình thường ": không nói chung. Kurtosis là khoảnh khắc thứ tư, một khu vực: không; kurtosis như được định nghĩa ở đây là một tỷ lệ không thứ nguyên, dựa trên khoảnh khắc thứ tư và thứ hai về giá trị trung bình.
Nick Cox

Khoảnh khắc thứ tư là một phần không thể thiếu, vì vậy nó là một khu vực. Làm thế nào khu vực đó được dịch thành đỉnh hoặc độ cong bị mất đối với tôi.
David W. Locke

Họ giải thích điển hình của kurtosis là đỉnh điểm, nhưng đó là sai lầm trong quan điểm của tôi. Tôi sẽ chỉnh sửa phản hồi ban đầu của mình để thay đổi độ lệch khi nói rằng sự bực bội là ... Cảm ơn.
David W. Locke

Các đuôi không đối xứng. Tôi chưa bao giờ thấy bất cứ điều gì về suy luận thống kê xem xét các đuôi không số học. Nguy cơ Kurtosis xảy ra vì đuôi sẽ di chuyển khi nhiều điểm dữ liệu được thu thập. Skew và kurtosis là về việc không có đủ dữ liệu để đạt được một tiêu chuẩn bình thường.
David W. Locke

1
Không phải như vậy: có một khối lượng lý thuyết và ứng dụng cho cấp số nhân, gamma, Weibull và nhiều, nhiều phân phối khác không bình thường.
Nick Cox
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.