Tôi chân thành hy vọng rằng tôi đã đặt câu hỏi này theo cách mà nó có thể được trả lời dứt khoát - nếu không, xin vui lòng cho tôi biết và tôi sẽ thử lại! Tôi cũng nên đoán rằng tôi sẽ sử dụng R cho các phân tích này.
Tôi có một số biện pháp plant performance (Ys)
mà tôi nghi ngờ đã bị ảnh hưởng bởi bốn phương pháp điều trị mà tôi áp đặt-- flower thinning (X1), fertilization (X2), leaf clipping (X3)
và biased flower thinning (X4)
. Đối với tất cả các Y có thể, N ít nhất là 242, vì vậy cỡ mẫu của tôi lớn. Tất cả các lô đều có thể bị mỏng đi hoặc không, nhưng mỗi lô cũng phải chịu một (và chỉ một) trong ba phương pháp điều trị khác (hoặc không - cũng có các ô kiểm soát). Ý tưởng của thiết kế này là để kiểm tra xem ba phương pháp điều trị khác có khả năng "che lấp" hay "tăng cường" hiệu quả của việc tỉa thưa hay không. Do đó, theo thiết kế, ba phương pháp điều trị sau (X2 - X4) không thể tương tác với nhau vì chúng không giao nhau, nhưng chúng có thể tương tác với tỉa hoa - và chúng có thể làm được.
Giả thuyết rõ ràng của tôi là 1) tỉa hoa sẽ có ý nghĩa và 2) các thuật ngữ tương tác, X1*X2, X1*X3, and X1*X4,
giữa tỉa hoa và ba phương pháp điều trị khác cũng sẽ có ý nghĩa. Đó là, tỉa hoa nên có vấn đề, nhưng những cách mà nó quan trọng nên được thay đổi đáng kể bởi những gì ba phương pháp điều trị khác đã làm.
Tôi muốn bao gồm tất cả các thông tin này trong một mô hình hỗn hợp:
Y ~ X0 + X1 + X2 + X3 + X4 + X1*X2 + X1*X3 + X1*X4 + (Up to three random effects)
Nhưng có một vấn đề: Tôi có lý do chính đáng để tin rằng ảnh hưởng của việc làm mỏng đối với Y là phi tuyến tính. Chúng có thể là bậc hai nhưng thậm chí có thể là khối trong một số trường hợp. Điều này là do ảnh hưởng của việc làm mỏng đối với hiệu suất rất có khả năng tăng nhanh hơn ở mức độ mỏng hơn. Nếu tôi cố gắng mô hình hóa mối quan hệ phi tuyến tính này thông qua phương trình trên bằng cách thêm các thuật ngữ bậc hai và bậc ba cho X1, thì tôi không chắc làm thế nào để mô hình hóa các thuật ngữ tương tác - tôi có nên bao gồm mọi kết hợp có thể có của X1, (X1) ^ 2 và (X1) ^ 3 * X2, X3 và X4? Bởi vì có vẻ như có rất nhiều tham số để cố gắng ước tính, ngay cả với số điểm dữ liệu tôi có và tôi không chắc làm thế nào để diễn giải kết quả mà tôi sẽ nhận được. Điều đó nói rằng, tôi không có lý do sinh học để nghĩ rằng đây sẽ là một cách thiếu thận trọng để mô hình hóa tình huống.
Vì vậy, tôi có ba suy nghĩ về cách giải quyết vấn đề này:
- Trước tiên, điều chỉnh một mô hình nhỏ hơn
Y ~ X1 + X1^2 + X^3 + Random effects
, với mục đích duy nhất là tìm hiểu xem mối quan hệ giữa pha loãng và Y là tuyến tính, bậc hai hay khối, sau đó chuyển đổi độ mỏng thông qua căn bậc hai hoặc khối vuông để tuyến tính hóa mối quan hệ một cách thích hợp. Từ đó, các thuật ngữ tương tác có thể được mô hình hóa như trên với biến được chuyển đổi.- Giả sử rằng các tương tác quan trọng, nếu chúng xảy ra, chỉ ảnh hưởng đến một trong các thuật ngữ X1 (nghĩa là chỉ các thuật ngữ tuyến tính, bậc hai hoặc khối) và mô hình hóa các tương tác tương ứng. Tôi thậm chí không chắc cách tiếp cận này có ý nghĩa.
- Chỉ cần phù hợp với "mô hình đầy đủ" với mọi điều khoản tương tác có thể có giữa các điều khoản tỉa thưa và các phương pháp điều trị khác như đã thảo luận ở trên. Sau đó, cắt tỉa các thuật ngữ tương tác không đáng kể và sử dụng biểu đồ và các kỹ thuật khác để diễn giải kết quả.
Cách tiếp cận nào trong số này, nếu có, có ý nghĩa nhất và tại sao, cho rằng tôi quan tâm đến thử nghiệm giả thuyết và không chọn mô hình? Cụ thể, nếu # 1 ở trên không có ý nghĩa để làm, tại sao vậy? Tôi đã đọc bài viết này và bài viết này và đã cố gắng tiêu hóa những gì chúng có thể có ý nghĩa đối với tôi, nhưng bất kỳ nguồn nào để đọc thêm cũng sẽ được đánh giá cao!