Cạm bẫy của mô hình hỗn hợp tuyến tính


18

Một số những cạm bẫy chính của việc sử dụng các mô hình hiệu ứng hỗn hợp tuyến tính là gì? Những điều quan trọng nhất để kiểm tra / xem ra trong việc đánh giá sự phù hợp của mô hình của bạn là gì? Khi so sánh các mô hình của cùng một bộ dữ liệu, những điều quan trọng nhất cần tìm là gì?

Câu trả lời:


16

Đây là một câu hỏi hay.

Dưới đây là một số cạm bẫy phổ biến:

  1. Sử dụng lý thuyết khả năng tiêu chuẩn, chúng tôi có thể rút ra một bài kiểm tra để so sánh hai giả thuyết lồng nhau, H 1 , bằng cách tính toán thống kê kiểm tra tỷ lệ khả năng. Phân phối null của thống kê kiểm tra này xấp xỉ bằng bình phương với mức độ tự do bằng với sự khác biệt về kích thước của hai không gian tham số. Thật không may, bài kiểm tra này chỉ gần đúng và yêu cầu một số giả định. Một giả định quan trọng là các tham số dưới null không nằm trên ranh giới của không gian tham số. Vì chúng ta thường quan tâm đến việc kiểm tra giả thuyết về những ảnh hưởng ngẫu nhiên mà mang hình thức: H 0 : σ 2 = 0 Đây là một mối quan tâm thực sự.H0H1

    H0:σ2= =0
    Cách để khắc phục vấn đề này là sử dụng REML. Tuy nhiên, giá trị p sẽ có xu hướng lớn hơn mức cần thiết. Điều này có nghĩa là nếu bạn quan sát thấy một hiệu ứng đáng kể bằng cách sử dụng xấp xỉ χ2, bạn có thể khá tự tin rằng nó thực sự có ý nghĩa. Các giá trị p nhỏ, nhưng không đáng kể có thể thúc đẩy người ta sử dụng các phương thức bootstrap chính xác hơn nhưng tốn thời gian hơn.
  2. So sánh các hiệu ứng cố định: Nếu bạn có kế hoạch sử dụng thử nghiệm tỷ lệ khả năng để so sánh hai mô hình lồng nhau chỉ khác nhau về hiệu ứng cố định của chúng, bạn không thể sử dụng phương pháp ước tính REML. Lý do là REML ước tính các hiệu ứng ngẫu nhiên bằng cách xem xét các kết hợp tuyến tính của dữ liệu loại bỏ các hiệu ứng cố định. Nếu các hiệu ứng cố định này được thay đổi, khả năng của hai mô hình sẽ không thể so sánh trực tiếp.

  3. Giá trị P: Giá trị p được tạo bởi phép thử tỷ lệ khả năng cho các hiệu ứng cố định là gần đúng và không may có xu hướng quá nhỏ, do đó đôi khi nói quá tầm quan trọng của một số hiệu ứng. Chúng tôi có thể sử dụng các phương pháp bootstrap không theo tỷ lệ để tìm giá trị p chính xác hơn cho kiểm tra tỷ lệ khả năng.

  4. Có những lo ngại khác về giá trị p cho thử nghiệm hiệu ứng cố định được đánh dấu bởi Tiến sĩ Doug Bates [ tại đây ].

Tôi chắc chắn các thành viên khác của diễn đàn sẽ có câu trả lời tốt hơn.

Nguồn: Mở rộng mô hình tuyến tính với R - Tiến sĩ Julain Faraway.


9

Cạm bẫy phổ biến mà tôi thấy là bỏ qua phương sai của các hiệu ứng ngẫu nhiên. Nếu nó lớn so với phương sai dư hoặc phương sai của biến phụ thuộc, sự phù hợp thường trông đẹp, nhưng chỉ vì các hiệu ứng ngẫu nhiên chiếm tất cả các phương sai. Nhưng vì biểu đồ của thực tế so với dự đoán có vẻ tốt, bạn có xu hướng nghĩ rằng mô hình của bạn là tốt.

Mọi thứ sụp đổ khi mô hình như vậy được sử dụng để dự đoán dữ liệu mới. Thông thường sau đó bạn chỉ có thể sử dụng các hiệu ứng cố định và sự phù hợp có thể rất kém.


6

Mô hình hóa cấu trúc phương sai được cho là tính năng duy nhất mạnh mẽ và quan trọng nhất của các mô hình hỗn hợp. Điều này mở rộng ra ngoài cấu trúc phương sai để bao gồm mối tương quan giữa các quan sát. Phải thận trọng để xây dựng một cấu trúc hiệp phương sai thích hợp nếu không các xét nghiệm về các giả thuyết, khoảng tin cậy và ước tính của phương tiện điều trị có thể không hợp lệ. Thông thường người ta cần có kiến ​​thức về thí nghiệm để xác định các hiệu ứng ngẫu nhiên chính xác.

SAS cho Mô hình hỗn hợp là nguồn tài nguyên của tôi, ngay cả khi tôi muốn thực hiện phân tích trong R.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.