Tách lô trong R


8

Tôi có một bộ dữ liệu gồm điểm chuẩn và mẫu con trong mỗi điểm chuẩn. Tôi chạy các điểm chuẩn này và các mẫu con của chúng trên các máy chủ đề . 'Cá nhân' được nghiên cứu bởi các mẫu con là giống nhau cho từng máy chủ đề và điểm chuẩn là giống nhau cho từng máy chủ đề.nmp

Làm cách nào để thực hiện ANOVA trong R trong tình huống này?

Chủ yếu tôi muốn tính tổng trung bình và khoảng tin cậy. Tôi không quan tâm đến mẫu phụ có nghĩa là gì, nhưng tôi muốn nhận ra sự sao chép ở đó trong sự tự tin và phương tiện cuối cùng. Tôi có thể quan tâm về điểm chuẩn có nghĩa là mặc dù. Tôi không thể tìm ra cách thiết lập anova này trong R. Tôi muốn có thể sao chép phương tiện bằng cách tính toán thủ công.

Tôi đã cố gắng glm, anova, aov, và lmenhưng tôi hoàn toàn nhầm lẫn. Tôi nghĩ rằng kết quả ANOVA phải tương đương với hai máy chủ thể với giá trị trung bình lồng nhau của máy / điểm chuẩn / điểm kiểm tra, nhưng phương tiện không xuất hiện giống nhau khi tôi thử chúng.

Biên tập:

Tôi đang bắt đầu nhận được manh mối từ http://zoonek2.free.fr/UNIX/48_R/13.html


1
Câu hỏi này đã được hỏi nhiều lần trong danh sách này. Đây là câu trả lời ngắn. Tôi viết một câu trả lời chi tiết sau đó trong ngày.
suncoolsu

Cảm ơn vì câu trả lời nhanh của bạn. Tôi xin lỗi vì đã không tìm thấy các câu trả lời khác, nhưng tôi không hiểu đủ về thuật ngữ để biết cách đặt câu hỏi.
Alex Brown

Tôi nghĩ rằng tất cả chúng ta đang học ở đây. Ổn mà!
suncoolsu

Câu trả lời:


13

Sự khác biệt chính giữa thiết kế lô tách và các thiết kế khác như thiết kế ngẫu nhiên hoàn toàn và các biến thể của thiết kế khối là cấu trúc lồng nhau của các đối tượng, nghĩa là khi các quan sát được lấy từ cùng một đối tượng (đơn vị thử nghiệm) nhiều lần. Điều này dẫn đến một cấu trúc tương quan trong một chủ đề trong thiết kế biểu đồ phân tách khác với cấu trúc tương quan trong một khối.

Chúng ta hãy lấy một hình ảnh ví dụ về tập dữ liệu từ một thiết kế chia ô đơn giản (bên dưới). Đây là một nghiên cứu về thành phần chế độ ăn uống về sức khỏe, bốn chế độ ăn kiêng được phân ngẫu nhiên cho 12 đối tượng, tất cả đều có tình trạng sức khỏe tương tự. Huyết áp cơ sở đã được thiết lập, và một biện pháp sức khỏe là thay đổi huyết áp sau hai tuần. Huyết áp được đo vào buổi sáng và buổi tối. (Ví dụ được sao chép từ ví dụ cuốn sách Thiết kế thống kê của Casella 5.1)

 Diet1Diet2Diet3Diet4 SubjectSubjectSubjectSubject 123456789101112MorningxxxxxxxxxxxxEveningxxxxxxxxxxxx

Một vài điều quan trọng cần lưu ý:

  • Có 12 đơn vị thí nghiệm (12 môn)
  • Trên 12 đơn vị này, chúng tôi quan sát 24 điểm dữ liệu ( 2×4×3), đóng góp bởi x
  • Điều này là như vậy bởi vì chúng tôi thực hiện hai quan sát về cùng một chủ đề, thứ nhất vào buổi sáng và thứ hai vào buổi tối
  • Điều này có nghĩa là hai quan sát về một đối tượng là từ cùng một đơn vị thử nghiệm. Do đó, đây không phải là bản sao đúng. Bởi vì các quan sát được lấy từ cùng một chủ đề trong quá trình thời gian, nên phải có một số mối tương quan giữa hai quan sát.
  • Lưu ý rằng điều này khác với ANOVA hai chiều với Chế độ ăn uốngThời gian là các yếu tố.
  • Một ANOVA hai chiều sẽ có những quan sát như thế này:

 Diet1Diet2Diet3Diet4MorningxxxxxxxxxxxxEveningxxxxxxxxxxxx

mỗi xs ở đây là những đối tượng khác nhau. Điều này minh họa khái niệm về làm tổ. Nghĩa là, các đối tượng 1, 2, 3 được lồng trong Chế độ ăn kiêng 1. - Toàn bộ các ô, các đơn vị thử nghiệm ở toàn bộ cấp độ (Chế độ ăn uống) (Đối tượng) đóng vai trò là các khối cho việc xử lý lô tách (Sáng-Tối)

Mô hình cho thiết kế lô tách này là:

Yijk=μ+τi+Sij+γk+(τγ)ik+ϵijk,
Ở đâu
Yijk=the response to diet i of subject j at time k,
τi=diet i effect
Sij=subject j's effect in diet i (whole plot error)
(τγ)ik=the interaction of diet i and time j
ϵijk=split plot error
Một khi bạn có mô hình được xây dựng tốt, viết R aovdưới dạng là chuyện nhỏ:
splitPltMdl <- aov(bloodPressure ~ Diet + ## Diet effect 
                                   Error(Subject/Diet) + ## nesting of Subject in Diet 
                                   Time*Diet, ## interaction of Time and Diet 
                                   data = dietData)

1
+1 câu trả lời hay. Nếu bây giờ bạn có thể giải thích cho tôi cách bạn thực hiện một số bài kiểm tra sau đại học hoặc so sánh theo kế hoạch (ví dụ: có sự khác biệt giữa buổi sáng và buổi tối trong các nhóm 1 & 2, gộp lại), bạn sẽ trả lời tôi rất nhiều câu hỏi. Xem thêm câu hỏi của tôi về R-help: article.gmane.org/gmane.comp.lang.r.general/237681
Henrik

Hiện tại tôi hơi bận. Tôi chắc chắn sẽ trở lại với bạn.
suncoolsu

@suncoolsu: ... chắc chắn sẽ giao hàng?
russellpierce

Tại sao bạn không bao gồm hiệu ứng Thời gian trong công thức mô hình của mình? Tại sao bạn bao gồm DietTime*Diettrong aovcuộc gọi? Nó phải Time:Dietphù hợp với công thức toán học của bạn.
amip
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.