Vấn đề này dường như luôn ủng hộ cái đầu xấu xí của nó mọi lúc, và tôi đang cố gắng giải mã nó để hiểu sự thống kê của riêng tôi (và sự tỉnh táo!).
Các giả định của các mô hình tuyến tính nói chung (kiểm tra t, ANOVA, hồi quy, v.v.) bao gồm "giả định về tính quy tắc", nhưng tôi đã thấy điều này hiếm khi được mô tả rõ ràng.
Tôi thường đi qua thống kê giáo trình / hướng dẫn / vv chỉ đơn giản nói rằng "giả định về trạng thái bình thường" áp dụng cho mỗi nhóm (ví dụ, các biến X phân loại), và chúng tôi chúng ta nên xem xét khởi hành từ bình thường cho mỗi nhóm .
Câu hỏi :
giả định có đề cập đến các giá trị của Y hoặc phần dư của Y không?
cho một cụ thể nhóm , là nó có thể để có một mạnh phân phối không bình thường của Y giá trị (ví dụ, lệch) NHƯNG một xấp xỉ (hoặc ít nhất là bình thường hơn) phân phối của dư của Y?
Các nguồn khác mô tả rằng giả định liên quan đến phần dư của mô hình (trong trường hợp có các nhóm, ví dụ: t-tests / ANOVA), và chúng ta nên kiểm tra sự ra đi của tính quy tắc của các phần dư này (nghĩa là chỉ có một âm mưu / thử nghiệm QQ để chạy).
sự quy phạm của phần dư cho mô hình có ngụ ý tính quy phạm của phần dư cho các nhóm không? Nói cách khác, chúng ta có nên kiểm tra phần dư của mô hình (trái với hướng dẫn trong nhiều văn bản) không?
Để đặt điều này trong một bối cảnh, hãy xem xét ví dụ giả thuyết này:
- Tôi muốn so sánh chiều cao cây (Y) giữa hai quần thể (X).
- Trong một quần thể, sự phân bố của Y bị lệch rất mạnh (nghĩa là hầu hết các cây đều ngắn, rất ít chiều cao), trong khi các cây khác hầu như bình thường
- Chiều cao tổng thể cao hơn trong dân số phân phối bình thường (cho thấy có thể có sự khác biệt 'thực').
- Chuyển đổi dữ liệu không cải thiện đáng kể sự phân bố của dân số đầu tiên.
Thứ nhất, có hợp lệ để so sánh các nhóm được phân phối chiều cao hoàn toàn khác nhau không?
Làm thế nào để tôi tiếp cận "giả định về tính quy tắc" ở đây? Nhớ lại chiều cao trong một dân số thường không được phân phối. Tôi có kiểm tra phần dư cho cả hai quần thể HOẶC phần dư cho mô hình (kiểm tra t) không?
Vui lòng tham khảo các câu hỏi theo số trong câu trả lời, kinh nghiệm đã cho tôi thấy mọi người bị lạc hoặc bị bỏ rơi dễ dàng (đặc biệt là tôi!). Hãy nhớ rằng tôi không phải là một nhà thống kê; mặc dù tôi có một cách hợp lý khái niệm (tức là, không! kỹ thuật) sự hiểu biết của thống kê.
Tái bút, tôi đã tìm kiếm tài liệu lưu trữ và đọc các chủ đề sau mà không củng cố sự hiểu biết của tôi:
- ANOVA giả định bình thường / phân phối bình thường của phần dư
- Định mức của phần dư so với dữ liệu mẫu; những gì về bài kiểm tra t?
- Là thử nghiệm thông thường 'về cơ bản là vô dụng'?
- Kiểm tra tính chuẩn
- Đánh giá tính bình thường của phân phối
- Những thử nghiệm nào tôi sử dụng để xác nhận rằng phần dư được phân phối bình thường?
- Phải làm gì khi xét nghiệm Kolmogorov-Smirnov có ý nghĩa đối với phần dư của xét nghiệm tham số nhưng độ lệch và kurtosis trông bình thường?