Hiểu được ảnh hưởng của một yếu tố ngẫu nhiên liên tục trong mô hình hiệu ứng hỗn hợp


10

Tôi hiểu tác động của hiệu ứng ngẫu nhiên phân loại đối với mô hình hiệu ứng hỗn hợp ở chỗ nó thực hiện gộp một phần các quan sát theo mức độ trong hiệu ứng ngẫu nhiên, giả định rằng các quan sát không tự độc lập mà chỉ có các nhóm riêng lẻ. Theo hiểu biết của tôi, trong các quan sát mô hình như vậy có cùng mức hiệu ứng ngẫu nhiên nhưng khác nhau về mức hiệu ứng cố định của chúng sẽ vượt xa các quan sát khác nhau về cả hiệu ứng ngẫu nhiên và mức hiệu ứng cố định.

Ảnh hưởng của một yếu tố ngẫu nhiên liên tục sau đó là gì? Cho rằng một mô hình không có hiệu ứng ngẫu nhiên cho thấy hiệu ứng cố định có kích thước hiệu ứng X. Tôi có nên hy vọng rằng nếu các quan sát ở các mức khác nhau của hiệu ứng cố định đến từ đầu xa của hiệu ứng ngẫu nhiên liên tục thì kích thước hiệu ứng sẽ trở nên nhỏ hơn trong một mô hình bao gồm yếu tố ngẫu nhiên, trong khi nếu các quan sát ở các mức yếu tố cố định khác nhau có giá trị hiệu ứng ngẫu nhiên tương tự thì kích thước hiệu ứng sẽ tăng?


1
Bạn có thể cung cấp các công thức và / hoặc mã R / Stata để minh họa cho suy nghĩ của bạn không? Bạn đang sử dụng một ngôn ngữ hơi khác thường ... ít nhất là khác thường đối với tôi. Tôi nghĩ rằng "yếu tố ngẫu nhiên liên tục" của bạn là cái mà tôi sẽ gọi là "độ dốc ngẫu nhiên", nhưng trước tiên tôi muốn kiểm tra.
StasK

@StasK Theo thuật ngữ R: nếu yếu tố ngẫu nhiên là phân loại (yếu tố trong R) thì các quan sát được gộp một phần, nghĩa là nhóm có nghĩa là (mức yếu tố ngẫu nhiên) là trung bình trọng số của trung bình dân số và nhóm không có nghĩa là tỷ lệ theo tỷ lệ đến cỡ mẫu và nghịch đảo của phương sai. Câu hỏi của tôi là, những gì đang được thực hiện khi yếu tố ngẫu nhiên là liên tục (số theo thuật ngữ R). Điều đó ảnh hưởng đến mô hình như thế nào?
Roey Angel

1
@RoeyAngel: có lẽ nó không ảnh hưởng đến nó theo bất kỳ cách hợp lý nào. Cụ thể R, lmerví dụ, một mô hình trong đó hiệu ứng ngẫu nhiên có giá trị riêng cho từng điểm dữ liệu sẽ không thể tính toán được. Hãy nghĩ về nó theo các khái niệm thuần túy: nếu ma trận của bạn là hình vuông thì vectơ giữ hiệu ứng ngẫu nhiên sẽ có kích thước ( : # của các điểm mẫu) và do đó bạn sẽ có cấu trúc lỗi không xác định được. Bạn có chắc là bạn đang hỏi điều này? Là StasK, tôi cũng thấy hơi khó theo dõi câu hỏi của bạn. ZγNN
usεr11852

@ user11852 hmmm Thật lòng tôi không bao giờ thử nó với hiệu ứng ngẫu nhiên trong đó mỗi điểm có một giá trị duy nhất. Vì vậy, về cơ bản, bạn đang nói rằng một hiệu ứng ngẫu nhiên luôn được coi là một yếu tố phân loại (ví dụ, không có sự song song với cách các lọ liên tục được xử lý trong ANCOVA chẳng hạn).
Roey Angel

@RoeyAngle: Tôi không biết cụ thể về ANCOVA, nhưng chắc chắn những gì tôi đã nói về các giá trị không thể nhận dạng. Bạn không thể ước tính nếu bằng với kích thước dữ liệu của bạn. Nó đã được coi là phân loại như phản ánh một cấu trúc (ví dụ: phân loại) của chính dữ liệu (ví dụ: lô, nhóm, vị trí, v.v.). Hãy nghĩ về nó trong bối cảnh của các mô hình phân cấp (một tập hợp con của các mô hình hỗn hợp): nếu một hệ thống phân cấp được xác định ở một mức độ nào đó có nhiều hậu duệ như các điểm dữ liệu thì nó sẽ là dự phòng. γγZ
usεr11852

Câu trả lời:


1

Tôi đã phải suy nghĩ kỹ về những gì bạn đang hỏi. Lúc đầu, tôi nghĩ dọc theo dòng @ user11852, rằng bạn muốn mọi quan sát đều có hiệu ứng ngẫu nhiên độc đáo của riêng mình. Điều đó sẽ làm cho mô hình vô vọng không xác định được, vì sẽ không có cách nào có thể hiểu được để phân biệt sự thay đổi hiệu ứng ngẫu nhiên với lỗi mô hình.

Nhưng tôi tin rằng trong phạm vi câu hỏi dự định của bạn, tất cả các hiệu ứng ngẫu nhiên thực sự liên tục và có thể được phân phối bình thường. Tuy nhiên, việc ám chỉ "phân loại" của bạn không nằm ngoài tường, bởi vì ma trận thiết kế cho một chặn ngẫu nhiên (thường được gọi là Z) sẽ trông giống như một ma trận thiết kế cho một biến phân loại.

Chúng ta hãy thêm một chút cụ thể và nói rằng công cụ dự đoán tuyến tính là trong đó và là những hiệu ứng cố định và và là tác ngẫu nhiên cụ thể. Tôi nghĩ rằng bằng cách "liên tục", bạn có nghĩa là một hiệu ứng ngẫu nhiên như chứ không phải là . Lưu ý rằng cả hai điều này vẫn không đổi trong một chủ đề .

(α¯+αi)+(β¯+βi)xij,
α¯β¯αiβiiβiαii

Bây giờ hãy nghĩ về tình huống đề xuất của bạn:

các mức độ khác nhau của hiệu ứng cố định đến từ đầu xa của hiệu ứng ngẫu nhiên liên tục

Nếu chúng tôi coi là hiệu ứng cố định, thì nó không thể có các mức khác nhau, nhưng có thể. Giả sử rằng với các giá trị nhỏ của , độ dốc nhỏ hơn; âm đối với các đối tượng có giá trị chủ yếu là . Bây giờ bằng cách xây dựng, các cực trị của tương ứng với các cực trị trong .β¯xijxijβiixijxijβi

Điều đó để lại cho chúng ta những gì xảy ra với vs mà không có hiệu ứng ngẫu nhiên. Suy nghĩ của tôi là, nếu chỉ có một vài trường hợp cực đoan của tình huống ở trên, việc thêm một hiệu ứng ngẫu nhiên sẽ có xu hướng kéo ước tính của lên cao. Nhưng tôi không hoàn toàn chắc chắn. Trong mô hình hỗn hợp tuyến tính truyền thống, các ước tính của các hiệu ứng cố định thực sự chỉ là ước tính bình phương nhỏ nhất có trọng số. Mặc dù các trọng số này có liên quan trực tiếp đến phân phối hiệu ứng ngẫu nhiên, tác động của chúng sẽ giảm dần khi kích thước mẫu của bạn tăng lên. Trong một thiết lập thực tế với kích thước mẫu thậm chí vừa phải, tôi sẽ không mong đợi bất cứ điều gì quá cực đoan xảy ra với ước tính hiệu ứng cố định của bạn khi bạn thêm vào một hiệu ứng ngẫu nhiên.β

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.