Tôi có một số dữ liệu nhìn từ biểu đồ của phần dư so với thời gian gần như bình thường nhưng tôi muốn chắc chắn. Làm thế nào tôi có thể kiểm tra tính bình thường của phần dư lỗi?
Tôi có một số dữ liệu nhìn từ biểu đồ của phần dư so với thời gian gần như bình thường nhưng tôi muốn chắc chắn. Làm thế nào tôi có thể kiểm tra tính bình thường của phần dư lỗi?
Câu trả lời:
Không có bài kiểm tra nào sẽ cho bạn biết số dư của bạn thường được phân phối. Trong thực tế, bạn có thể đặt cược một cách đáng tin cậy rằng họ không .
Các thử nghiệm giả thuyết thường không phải là một ý tưởng tốt khi kiểm tra các giả định của bạn. Ảnh hưởng của tính không quy tắc đến suy luận của bạn nói chung không phải là một hàm của cỡ mẫu *, nhưng kết quả của một bài kiểm tra quan trọng là . Một sai lệch nhỏ so với tính quy tắc sẽ rõ ràng ở cỡ mẫu lớn mặc dù câu trả lời cho câu hỏi về lợi ích thực tế ('đến mức độ nào điều này đã ảnh hưởng đến suy luận của tôi?') Có thể 'hầu như không'. Tương ứng, độ lệch lớn so với tính chuẩn ở cỡ mẫu nhỏ có thể không đạt được ý nghĩa.
* (được thêm vào trong chỉnh sửa) - thực sự đó là một tuyên bố quá yếu. Tác động của tính phi quy tắc thực sự giảm theo kích thước mẫu bất cứ khi nào định lý của CLT và Slutsky sẽ được duy trì, trong khi khả năng từ chối tính quy tắc (và có lẽ là tránh các quy trình lý thuyết thông thường) tăng theo kích thước mẫu ... bạn hầu như có thể xác định tính phi quy tắc có xu hướng khi nó không thành vấn đề † dù sao ... và thử nghiệm không giúp ích gì khi nó thực sự quan trọng, trong các mẫu nhỏ.
tốt, ít nhất là đến mức ý nghĩa đi. Công suất vẫn có thể là một vấn đề mặc dù nếu chúng ta đang xem xét các mẫu lớn như ở đây, thì đó cũng có thể là một vấn đề ít hơn.
Những gì đến gần hơn để đo kích thước hiệu ứng là một số chẩn đoán (có thể là hiển thị hoặc thống kê) đo lường mức độ không bình thường theo một cách nào đó. Biểu đồ QQ là một màn hình hiển thị rõ ràng và một biểu đồ QQ từ cùng một dân số ở một cỡ mẫu và ở một cỡ mẫu khác nhau ít nhất là cả hai ước tính ồn ào của cùng một đường cong - hiển thị gần như 'không bình thường'; ít nhất nó phải liên quan đơn điệu đến câu trả lời mong muốn cho câu hỏi quan tâm.
Nếu bạn phải sử dụng một bài kiểm tra, Shapiro-Wilk có thể cũng tốt như mọi thứ khác (bài kiểm tra Chen-Shapiro thường tốt hơn một chút so với các lựa chọn thay thế của mối quan tâm chung, nhưng khó tìm ra cách triển khai hơn) - nhưng nó trả lời một câu hỏi cho bạn đã biết câu trả lời cho; mỗi khi bạn không từ chối, nó sẽ đưa ra câu trả lời mà bạn có thể chắc chắn là sai.
Thử nghiệm Shapiro-Wilk là một khả năng.
Thử nghiệm này được thực hiện trong hầu hết các gói phần mềm thống kê. Giả thuyết null là phần dư được phân phối bình thường, do đó giá trị p nhỏ cho biết bạn nên từ chối null và kết luận phần dư không được phân phối bình thường.
Lưu ý rằng nếu kích thước mẫu của bạn lớn, bạn sẽ hầu như luôn từ chối, vì vậy trực quan của phần dư là quan trọng hơn.
Từ wikipedia:
Các thử nghiệm về tính quy tắc đơn biến bao gồm thử nghiệm bình phương K của D'Agostino, thử nghiệm Jarque Muff Bera, thử nghiệm Andersonling Darling, tiêu chí Cramériêu von Mise, thử nghiệm Lilliefors cho tính quy phạm (bản thân nó là một thử nghiệm của Kolmogorov. Thử nghiệm Shapiro về Wilk, thử nghiệm chi bình phương của Pearson và thử nghiệm Shapiro mật Francia. Một bài báo năm 2011 từ Tạp chí Mô hình hóa và Phân tích thống kê [1] kết luận rằng Shapiro-Wilk có sức mạnh tốt nhất cho một ý nghĩa nhất định, theo sát bởi Anderson-Darling khi so sánh Shapiro-Wilk, Kolmogorov-Smirnov, Lilliefors và Anderson- Em yêu kiểm tra.