Cách viết thuật ngữ lỗi trong các số đo lặp lại ANOVA theo R: Error (chủ đề) so với Error (chủ đề / thời gian)


10

Câu hỏi của tôi có liên quan rất chặt chẽ với một bài trước Xác định hạn Lỗi () trong các biện pháp lặp đi lặp lại ANOVA trong R . Tuy nhiên, tôi muốn hiểu rõ hơn về cách xác định thuật ngữ lỗi.

Giả sử tôi có ANOVA lặp lại hai chiều, Yếu tố giữa hiệu ứng nhóm là Điều trị (kiểm soát so với giả dược), trong khi Thời gian là hiệu ứng trong nhóm được đo lặp lại hơn 4 lần (T1 ~ T4). ID bệnh nhân được ghi là Chủ đề. Ở đây tôi đã mượn dữ liệu từ một ví dụ từ hướng dẫn trong http://gjkerns.github.io/R/2012/01/20/power-sample-size.html để dữ liệu trông như thế này

 Time Subject Method      NDI
 0min    1     Treat 51.01078
 15min   1     Treat 47.12314
 48hrs   1     Treat 26.63542
 96hrs   1     Treat 20.78196
 0min    2     Treat 42.61345
 15min   2     Treat 32.77171

Để áp dụng ANOVA:

aovComp <- aov(NDI ~ Time*Method + Error(Subject/Time), theData)
summary(aovComp)
Error: Subject
          Df Sum Sq Mean Sq F value Pr(>F)
Method     1    113   112.7   0.481  0.491
Residuals 58  13579   234.1              

Error: Subject:Time        
            Df Sum Sq Mean Sq F value  Pr(>F)    
Time          3  13963    4654 103.789 < 2e-16 ***
Time:Method   3   1221     407   9.074 1.3e-05 ***
Residuals   174   7803      45 

Tôi cũng đã thử thuật ngữ lỗi khác:

aovComp1 <- aov(NDI ~ Time*Method + Error(Subject), theData)
summary(aovComp1)

Error: Subject      
          Df Sum Sq Mean Sq F value Pr(>F)
Method     1    113   112.7   0.481  0.491
Residuals 58  13579   234.1               

Error: Within
             Df Sum Sq Mean Sq F value  Pr(>F)    
Time          3  13963    4654 103.789 < 2e-16 ***
Time:Method   3   1221     407   9.074 1.3e-05 ***
Residuals   174   7803      45

Ai đó có thể giúp tôi giải thích sự khác biệt giữa hai điều khoản lỗi này không? Nếu thuật ngữ đầu tiên là thuật ngữ chính xác, kết quả từ thuật ngữ lỗi thứ hai có nghĩa là gì?

Cập nhật bởi @amoeba: Hai kết quả đầu ra giống nhau nên dường như trong trường hợp này không có sự khác biệt, nhưng câu hỏi vẫn là sự khác biệt về nguyên tắc là gì . Được Error(subject)Error(subject/time)luôn luôn là điều tương tự?


3
xin lỗi, tôi chỉ nhận ra rằng hai thuật ngữ này cho kết quả như nhau. Vì vậy, tôi đoán họ giống nhau :-)
tiantianchen

1
Tôi đã hy vọng cho một lời giải thích cho điều này: /
vipin8169

Tất cả những gì tôi có thể thu thập về thuật ngữ lỗi là thế này >> "Trong thiết kế các biện pháp lặp đi lặp lại, chúng tôi cần chỉ định một thuật ngữ lỗi có sự thay đổi tự nhiên từ người tham gia sang người tham gia. (Ví dụ: tôi có thể phản ứng hơi khác với âm nhạc đáng sợ so với bạn làm bởi vì tôi yêu phim zombie và bạn ghét chúng!) Chúng tôi làm điều này với hàm Error (): cụ thể, chúng tôi đang nói rằng chúng tôi muốn kiểm soát sự thay đổi giữa những người tham gia đó đối với tất cả các biến trong chủ đề của chúng tôi. "
vipin8169

(+1) Chúng chỉ tương đương khi có chính xác 1 phép đo cho mỗi kết hợp đối tượng / thời gian. Nếu có nhiều phép đo hơn cho mỗi kết hợp đối tượng / thời gian (đơn giản là vì các phép đo được lặp lại hoặc do có một yếu tố bên trong đối tượng B khác, ngoài ra time), Error(subject)Error(subject/time)sẽ mang lại các giá trị F và p khác nhau cho time.
amip nói phục hồi Monica

Câu hỏi tương tự trên SO: stackoverflow.com/questions/37497948 - thật không may mà không có câu trả lời thỏa đáng nào cả (imho).
amip nói phục hồi Monica

Câu trả lời:


2

Đầu tiên, subject/timelà ký hiệu cho timelồng vào nhau subject, và do đó mở rộng thành hai phần subjectsubject:timetương tác. Vì vậy, câu hỏi trở nên đúng đắn hơn, khi nào nên xác định sự subject:timetương tác, và nó tạo ra sự khác biệt gì?

Trước khi trả lời câu hỏi này, một điều quan trọng khác cần nhận ra là tất cả các mô hình đều bao gồm một thuật ngữ lỗi bổ sung không cần chỉ định, đó là thuật ngữ lỗi liên quan đến các phép đo riêng lẻ (mức thấp nhất, nếu bạn nghĩ về phân cấp này).

Trong trường hợp này, sự subject:timetương tác là mức thấp nhất, luôn được bao gồm trong mô hình. Vì vậy, sử dụng Error(subject)Error(subject/time)cho kết quả tương tự; sự khác biệt duy nhất là ở đầu ra, mức kết quả đó được gọi Withincho lần đầu tiên và được gọi subject:timecho lần thứ hai.

Tuy nhiên, trong trường hợp có nhiều phép đo ở mỗi subject/timekết hợp, cần chỉ định subject:timetương tác, vì khi đó tương tác đó không ở mức thấp nhất.


(Tôi đã có một tiền thưởng mở cho câu hỏi này nhưng nó không may hết vào ngày hôm qua ...) +1, nhưng tôi nghĩ câu trả lời này vượt qua vấn đề có thể là vấn đề trung tâm ở đây: với sự có mặt của nhiều phép đo cho mỗi subject/timekết hợp, tại sao chúng ta nhất thiết phải muốn kiểm tra ảnh hưởng của timetương đối đến subject:timetương tác? Đây thực chất là nội dung câu hỏi của tôi ở đây stats.stackexchange.com/questions/286280 , vì vậy tôi sẽ mời bất kỳ độc giả tương lai nào của chủ đề này tìm kiếm để chứng minh khái niệm.
amip nói phục hồi Monica

Ngoài ra, có một Q và A rất giống nhau ở đây: stats.stackexchange.com/questions/247582 .
amip nói phục hồi Monica
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.