Hãy xem xét một đơn giản tuyến tính mô hình hỗn hợp, ví dụ như một mô hình đánh chặn ngẫu nhiên mà chúng tôi ước tính phụ thuộc của trên x trong các môn học khác nhau, và cho rằng từng đối tượng có chặn ngẫu nhiên riêng của họ: y = một + b x + c i + ε . Đây chặn c i được mô hình hóa như đến từ một phân phối Gaussian c i ~ N ( 0 , τ 2 ) và tiếng ồn ngẫu nhiên cũng là Gaussian ε ~ N ( 0 , σ 2yx
y=a+bx+ci+ϵ.
cici∼N(0,τ2)
Trongcú pháp mô hình này sẽ được viết là.
ϵ∼N(0,σ2).
lme4
y ~ x + (1|subject)
Hướng dẫn viết lại phần trên như sau:
y∣c∼N(a+bx+c,σ2)c∼N(0,τ2)
Đây là một cách chính thức hơn để xác định cùng một mô hình xác suất. Từ công thức này, chúng ta có thể thấy trực tiếp rằng các hiệu ứng ngẫu nhiên không phải là "tham số": chúng là các biến ngẫu nhiên không quan sát được. Vậy làm thế nào chúng ta có thể ước tính các tham số phương sai mà không biết các giá trị của c ?cic
Lưu ý rằng phương trình đầu tiên ở trên mô tả phân phối có điều kiện của cho c . Nếu chúng ta biết sự phân bố của c và y | c , sau đó chúng ta có thể làm việc ra các điều kiện phân phối của y bằng cách tích hợp trên c . Bạn có thể biết nó là Luật tổng xác suất . Nếu cả hai phân phối là Gaussian, thì kết quả phân phối vô điều kiện cũng là Gaussian.yccy∣cyc
Trong trường hợp này sự phân bố không điều kiện đơn giản là , nhưng các quan sát của chúng tôi không phải là mẫu iid từ nó bởi vì có rất nhiều phép đo mỗi môn học. Để tiến hành, chúng ta cần xem xét phân phối của toàn bộ nN(a+bx,σ2+τ2)n chiều vector của tất cả các quan sát: y ~ N ( một + b x , Σ ) nơi Σ = σ 2 Tôi n + τ 2 tôiy
y∼N(a+bx,Σ)
là ma trận khối chéo gồm
σ 2 và
τ 2 . Bạn yêu cầu trực giác nên tôi muốn tránh toán. Điểm quan trọng là phương trình này không có
c nữa!
Đâylà những gì người ta thực sự phù hợp với dữ liệu được quan sát và đó là lý do tại sao người ta nói rằng
c i không phải là tham số của mô hình.
Σ=σ2In+τ2IN⊗1Mσ2τ2cci
Khi các tham số , b , τ 2 và σ 2 phù hợp, người ta có thể tìm ra phân phối có điều kiện của c i cho mỗi i . Những gì bạn thấy trong đầu ra mô hình hỗn hợp là các chế độ của các phân phối này, còn gọi là các chế độ có điều kiện.abτ2σ2cii