Phân phối của tôi là bình thường; Thử nghiệm Kolmogorov-Smirnov không đồng ý


15

Tôi có một vấn đề với tính quy tắc của một số dữ liệu tôi có: Tôi đã thực hiện một thử nghiệm Kolmogorov nói rằng nó không bình thường với p = .0000, tôi không hiểu: độ lệch của phân phối của tôi = -. 497 và sự suy yếu = -0,024

Đây là cốt truyện phân phối của tôi trông rất bình thường ...

(Tôi có ba điểm và mỗi điểm này không bình thường với giá trị p đáng kể cho bài kiểm tra Kolmogorov ... Tôi thực sự không hiểu)

nhập mô tả hình ảnh ở đây

nhập mô tả hình ảnh ở đây


11
Làm thế nào để bạn biết nó bình thường? Nó không bình thường đối với tôi. Nó có vẻ lệch trái.
đánh dấu999

1
Tại sao bạn thử nghiệm cho sự bình thường?
Jack Aidley

Câu trả lời:


39
  1. Bạn không có cơ sở để khẳng định dữ liệu của bạn là bình thường. Ngay cả khi độ lệch và độ nhiễu quá mức của bạn đều chính xác bằng 0, điều đó không có nghĩa là dữ liệu của bạn là bình thường. Trong khi độ lệch và kurtosis cách xa các giá trị dự kiến ​​cho thấy tính không quy tắc, thì converse không giữ được. Có những bản phân phối không bình thường có cùng độ lệch và kurtosis như bình thường. Một ví dụ được thảo luận ở đây , mật độ được sao chép dưới đây:
    ngày 2,3

    Như bạn thấy, nó rõ ràng là lưỡng kim. Trong trường hợp này, phân phối là đối xứng, vì vậy miễn là có đủ khoảnh khắc tồn tại, số đo độ lệch điển hình sẽ là 0 (thực sự tất cả các biện pháp thông thường sẽ là). Đối với kurtosis, sự đóng góp cho khoảnh khắc thứ 4 từ khu vực gần với giá trị trung bình sẽ có xu hướng làm cho sự suy yếu nhỏ hơn, nhưng đuôi tương đối nặng, có xu hướng làm cho nó lớn hơn. Nếu bạn chọn vừa phải, kurtosis xuất hiện với giá trị tương tự như bình thường.

  2. Độ lệch mẫu của bạn thực sự là khoảng 0,5, điều này gợi ý về độ lệch trái nhẹ. Biểu đồ và biểu đồ QQ của bạn đều biểu thị như nhau - phân phối lệch trái nhẹ. (Độ lệch nhẹ như vậy dường như không phải là vấn đề đối với hầu hết các quy trình lý thuyết thông thường thông thường.)

  3. Bạn đang xem xét một số chỉ số khác nhau về tính phi quy tắc mà bạn không nên đồng ý với một ưu tiên , vì chúng xem xét các khía cạnh khác nhau của phân phối; với các mẫu nhỏ không bình thường, chúng sẽ không đồng ý.


Bây giờ cho câu hỏi lớn: * Tại sao bạn thử nghiệm tính bình thường? *

[chỉnh sửa trong phản hồi từ ý kiến:]

Tôi không thực sự chắc chắn, mặc dù tôi nên trước khi thực hiện ANOVA

Có một số điểm được thực hiện ở đây.

Tôi. Tính quy phạm là giả định của ANOVA nếu bạn sử dụng nó để suy luận (chẳng hạn như kiểm tra giả thuyết), nhưng nó không đặc biệt nhạy cảm với tính không quy tắc trong các mẫu lớn hơn - tính phi bình thường ít gây hậu quả và vì kích thước mẫu tăng phân phối có thể trở nên không bình thường hơn và thử nghiệm có thể chỉ bị ảnh hưởng một chút.

ii. Bạn dường như đang kiểm tra tính bình thường của phản hồi (DV). Bản thân phân phối (vô điều kiện) của DV không được coi là bình thường trong ANOVA. Bạn kiểm tra phần dư để đánh giá tính hợp lý của giả định về phân phối có điều kiện (nghĩa là thuật ngữ lỗi trong mô hình được giả định là bình thường) - tức là bạn dường như không nhìn đúng. Thật vậy, vì kiểm tra được thực hiện trên phần dư, bạn thực hiện nó sau khi lắp mô hình, thay vì trước đó.

iii. Thử nghiệm chính thức có thể bên cạnh vô dụng. Câu hỏi đáng quan tâm ở đây là 'mức độ phi bình thường ảnh hưởng đến suy luận của tôi tệ đến mức nào?', Mà thử nghiệm giả thuyết thực sự không đáp ứng. Khi kích thước mẫu càng lớn, thử nghiệm càng trở nên có thể phát hiện ra những khác biệt nhỏ so với tính quy phạm, trong khi hiệu ứng trên mức ý nghĩa trong ANOVA trở nên nhỏ hơn và nhỏ hơn. Đó là, nếu kích thước mẫu của bạn lớn một cách hợp lý, việc kiểm tra tính quy tắc chủ yếu là cho bạn biết bạn có cỡ mẫu lớn, điều đó có nghĩa là bạn có thể không phải lo lắng nhiều. Ít nhất với một cốt truyện QQ, bạn có một đánh giá trực quan về mức độ không bình thường của nó.

iv. ở các cỡ mẫu hợp lý, các giả định khác - như sự bình đẳng của phương sai và tính độc lập - nói chung quan trọng hơn nhiều so với tính phi quy tắc nhẹ. Lo lắng về các giả định khác trước ... nhưng một lần nữa, thử nghiệm chính thức không trả lời đúng câu hỏi

v. lựa chọn liệu bạn có thực hiện ANOVA hoặc một số thử nghiệm khác dựa trên kết quả của thử nghiệm giả thuyết có xu hướng có các tính chất tồi tệ hơn là quyết định hành động như thể giả định không giữ được. (Có nhiều phương pháp phù hợp với các phân tích giống như ANOVA một chiều trên dữ liệu không được coi là bình thường mà bạn có thể sử dụng bất cứ khi nào bạn không nghĩ rằng mình có lý do để thừa nhận tính bình thường. Một số có sức mạnh rất tốt ở mức bình thường, và với phần mềm tử tế, không có lý do gì để tránh chúng.)

[Tôi tin rằng tôi đã có một tài liệu tham khảo cho điểm cuối cùng này nhưng tôi không thể xác định vị trí của nó ngay bây giờ; nếu tôi tìm thấy nó, tôi sẽ cố gắng quay lại và đặt nó vào]


Tôi đọc biểu đồ của bạn như hiển thị khoảng tối thiểu 12 chế độ 48 tối đa 60, vì vậy tối thiểu đến chế độ là 36, chế độ tối đa là 12. Người ta không nên đọc quá nhiều vào các chi tiết như vậy, nhưng chúng hoàn toàn phù hợp với độ lệch trái.
Nick Cox

10

Thử nghiệm Kolmogorov-Smirnov có một chút sức mạnh khi kích thước mẫu lớn, do đó có thể dễ dàng bác bỏ giả thuyết khống rằng dữ liệu của bạn không khác với quy tắc. Nói cách khác, thử nghiệm đôi khi sẽ gợi ý rằng phân phối không bình thường trong các mẫu lớn ngay cả khi nó là bình thường đối với hầu hết các ý định.

Hãy nghĩ về nó giống như một bài kiểm tra t. Nếu bạn có hai quần thể khác nhau về chiều cao chỉ bằng một phần nghìn milimet, một mẫu cực kỳ lớn sẽ hỗ trợ về mặt thống kê rằng chúng khác nhau, ngay cả khi sự khác biệt là vô nghĩa.

Có lẽ bạn có thể dựa vào các phương pháp khác để xác định tính quy tắc của dữ liệu của bạn. Các lô bạn sử dụng là hai ví dụ tốt, cũng như các giá trị nghiêng / kurtosis.

Chủ đề khác này có vẻ đặc biệt liên quan: Thử nghiệm thông thường 'về cơ bản là vô dụng'?


Ồ ok, Nó đúng, kích thước mẫu của tôi khá lớn (n = 660), có thử nghiệm nào khác ít sai lệch bởi kích thước mẫu lớn không?
Boo

Thực hiện tìm kiếm trên trang web này và bạn có thể tìm thấy câu trả lời có liên quan. stats.stackexchange.com/questions/12261/testing-normalit stats.stackexchange.com/questions/2492/...
Behacad

13
Các xét nghiệm không bị sai lệch bởi kích thước mẫu rất lớn.
Peter Flom - Tái lập Monica

10

Thử nghiệm KolmogorovTHER Smirnov không phân phối khi giả thuyết null được chỉ định đầy đủ nếu điều chỉnh trung bình và phương sai từ dữ liệu chắc chắn sử dụng biến thể Lilliefors khi kiểm tra tính quy phạm (nếu bạn phải). Đó không phải là để đạt được các câu trả lời khác.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.