Tôi có một bộ dữ liệu của 482 quan sát.
data=Populationfull
Tôi sẽ làm một phân tích liên kết kiểu gen cho 3 SNP. Tôi đang cố gắng xây dựng một mô hình cho phân tích của tôi và tôi sử dụng aov (y ~ x, data = ...). Đối với một đặc điểm tôi có một số hiệu ứng cố định và đồng biến mà tôi đã đưa vào mô hình, như vậy:
Starts <- aov(Starts~Sex+DMRT3+Birthyear+Country+Earnings+Voltsec+Autosec, data=Populationfull) summary(Starts) Df Sum Sq Mean Sq F value Pr(>F) Sex 3 17.90 5.97 42.844 < 2e-16 *** DMRT3 2 1.14 0.57 4.110 0.017 * Birthyear 9 5.59 0.62 4.461 1.26e-05 *** Country 1 11.28 11.28 81.005 < 2e-16 *** Earnings 1 109.01 109.01 782.838 < 2e-16 *** Voltsec 1 12.27 12.27 88.086 < 2e-16 *** Autosec 1 8.97 8.97 64.443 8.27e-15 *** Residuals 463 64.48 0.14 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Tôi phát hiện ra rằng nếu tôi thay đổi thứ tự của các biến trong mô hình tôi có các giá trị p khác nhau, vui lòng xem bên dưới.
Starts2 <- aov(Starts~Voltsec+Autosec+Sex+DMRT3+Birthyear+Country+Earnings, data=Populationfull) summary(Starts2) Df Sum Sq Mean Sq F value Pr(>F) Voltsec 1 2.18 2.18 15.627 8.92e-05 *** Autosec 1 100.60 100.60 722.443 < 2e-16 *** Sex 3 10.43 3.48 24.962 5.50e-15 *** DMRT3 2 0.82 0.41 2.957 0.05294 . Birthyear 9 3.25 0.36 2.591 0.00638 ** Country 1 2.25 2.25 16.183 6.72e-05 *** Earnings 1 46.64 46.64 334.903 < 2e-16 *** Residuals 463 64.48 0.14 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Tại sao tôi nhận được các giá trị p khác nhau tùy theo thứ tự các biến / yếu tố / hiệp phương sai / fixedeffects (?) Được mã hóa theo thứ tự nào? Có cách nào để "sửa" cho nó không? Có thể là tôi sử dụng mô hình sai? Tôi vẫn còn khá mới ở R vì vậy nếu bạn có thể giúp tôi với điều này, xin hãy giữ nó thật đơn giản để tôi có thể hiểu câu trả lời hehe ... Cảm ơn bạn, hy vọng ai đó có thể giúp tôi hiểu điều này!
Earnings 1 109.01 109.01 782.838 < 2e-16 ***
chạy thứ hai của bạn Earnings 1 46.64 46.64 334.903 < 2e-16 ***
. Kết quả của bạn không giống nhau. Bắt đầu bằng cách kiểm tra để thấy rằng bạn chưa thực hiện nhiều hơn việc sắp xếp lại các biến.
car
gói - nó thực hiện ANOVA Loại II và Loại III, không phụ thuộc vào thứ tự của các biến, trong khi aov
Loại I ANOVA.
Populationfull
để làm cho vấn đề của bạn có thể tái tạo . Điều này không xảy ra với ví dụ từaov()
trang trợ giúp.summary(aov(yield ~ block + N + P + K, npk)); summary(aov(yield ~ K + P + block + N , npk))