Gamma GLM được liên kết với bản ghi Gaussian GLM được liên kết với bản ghi LM


12

Từ kết quả của tôi, có vẻ như GLM Gamma đáp ứng hầu hết các giả định, nhưng nó có phải là một cải tiến đáng giá so với LM chuyển đổi log không? Hầu hết các tài liệu tôi đã tìm thấy giao dịch với Poisson hoặc Binomial GLMs. Tôi thấy bài viết ĐÁNH GIÁ CÁC ĐÁNH GIÁ MÔ HÌNH LINEAR TỔNG HỢP SỬ DỤNG RANDOMIZATION rất hữu ích, nhưng nó thiếu các lô thực tế được sử dụng để đưa ra quyết định. Hy vọng ai đó có kinh nghiệm có thể chỉ cho tôi đi đúng hướng.

Tôi muốn mô hình phân phối biến trả lời của tôi T, có phân phối được vẽ dưới đây. Như bạn có thể thấy, đó là sự sai lệch tích cực :
XHTML hợp lệ.

Tôi có hai yếu tố phân loại để xem xét: METH và CASEPART.
Lưu ý rằng nghiên cứu này chủ yếu là thăm dò, về cơ bản phục vụ như một nghiên cứu thử nghiệm trước khi đưa ra lý thuyết về một mô hình và thực hiện DoE xung quanh nó.

Tôi có các mô hình sau trong R, với các sơ đồ chẩn đoán của chúng:

LM.LOG<-lm(log10(T)~factor(METH)+factor(CASEPART),data=tdat)

XHTML hợp lệ
XHTML hợp lệ

GLM.GAMMA<-glm(T~factor(METH)*factor(CASEPART),data=tdat,family="Gamma"(link='log'))

XHTML hợp lệ
XHTML hợp lệ

GLM.GAUS<-glm(T~factor(METH)*factor(CASEPART),data=tdat,family="gaussian"(link='log'))

XHTML hợp lệ
XHTML hợp lệ

Tôi cũng đã đạt được các giá trị P sau đây thông qua thử nghiệm Shapiro-Wilks trên phần dư:

LM.LOG: 2.347e-11  
GLM.GAMMA: 0.6288  
GLM.GAUS:  0.6288  

Tôi đã tính các giá trị AIC và BIC, nhưng nếu tôi đúng, họ không cho tôi biết nhiều do các gia đình khác nhau trong GLMs / LM.

Ngoài ra, tôi lưu ý các giá trị cực đoan, nhưng tôi không thể phân loại chúng là ngoại lệ vì không có "nguyên nhân đặc biệt" rõ ràng.



1
Điều đáng chú ý là cả ba mô hình đều được nhân lên theo nghĩa là sự gia tăng của một biến hồi quy có liên quan đến một sự thay đổi tương đối trong phản ứng điển hình. Đối với hai GLM log-linear, "điển hình" có nghĩa là trung bình số học, trong khi đối với LM chuyển đổi log chúng ta đang nói về các phương tiện hình học. Do đó, cách bạn muốn diễn giải các hiệu ứng và dự đoán cũng là một yếu tố thúc đẩy cho sự lựa chọn mô hình, không chỉ có các lô dư hoàn hảo (dù sao đây cũng là các dữ liệu được điều khiển).
Michael M

@MichaelMayer - Cảm ơn bạn đã phản hồi, rất hữu ích. Bạn có thể mở rộng một chút về chính xác cách lựa chọn ảnh hưởng đến việc giải thích? Hoặc chỉ cho tôi theo hướng của một tài liệu tham khảo?
TLJ

@ Marcinthebox- Tôi đã xem qua câu hỏi đó trước khi đăng. Không trả lời chính xác câu hỏi của tôi rất chính xác.
TLJ

Câu trả lời:


18

Chà, khá rõ ràng sự phù hợp log-linear với Gaussian là không phù hợp; có sự không đồng nhất mạnh mẽ trong phần dư. Vì vậy, hãy xem xét điều đó.

Những gì còn lại là lognatural vs gamma.

Lưu ý rằng biểu đồ của Tkhông được sử dụng trực tiếp, vì phân phối biên sẽ là một hỗn hợp của các biến thể (mỗi điều kiện trên một tập hợp các giá trị khác nhau cho các yếu tố dự đoán); ngay cả khi một trong hai mô hình là chính xác, cốt truyện đó có thể trông không giống phân phối có điều kiện.

Một trong hai mô hình xuất hiện chỉ là phù hợp như nhau trong trường hợp này. Cả hai đều có phương sai tỷ lệ với bình phương trung bình, do đó mô hình lây lan trong phần dư so với sự phù hợp là tương tự nhau.

Một ngoại lệ thấp sẽ phù hợp hơn một chút với gamma so với logic bất thường (ngược lại đối với ngoại lệ cao). Tại một giá trị trung bình và phương sai nhất định, lognatural có độ lệch nhiều hơn và có hệ số biến đổi cao hơn.

Một điều cần nhớ là kỳ vọng của lognatural không phải là điểm kinh nghiệm(μ); nếu bạn quan tâm đến ý nghĩa, bạn không thể chỉ cấp số mũ phù hợp với quy mô. Thật vậy, nếu bạn quan tâm đến giá trị trung bình, gamma sẽ tránh được một số vấn đề với logic bất thường (ví dụ: một khi bạn kết hợp độ không đảm bảo của tham số trongσ2trong lognatural, bạn có dự đoán dựa trên phân phối log-t, không có nghĩa. Khoảng dự đoán vẫn hoạt động tốt, nhưng đó có thể là một vấn đề để dự đoán giá trị trung bình.

Xem thêm tại đây ở đây cho một số cuộc thảo luận liên quan.


1
@Gleb_b câu trả lời này rất hữu ích cho phân tích của tôi. Tôi có một vài câu hỏi. (1) Đầu tiên, đây có phải là 'Cả hai đều có phương sai tỷ lệ với bình phương trung bình ...' dựa trên lô dư so với âm mưu được trang bị không? (2) Và đây có phải là 'Một ngoại lệ thấp sẽ phù hợp hơn một chút với gamma ... Ở một mức trung bình và phương sai nhất định, ...' dựa trên cốt truyện qq? (3) Từ những gì tôi hiểu glm (ví dụ gamma, poisson và nhị thức âm) không có giả định về tính quy tắc của phần dư và tính đồng nhất của phương sai. Nếu vậy, tại sao âm mưu dư so với âm mưu qq được trang bị và bình thường có liên quan đến chẩn đoán?
chiếu

2
Điều này đủ rộng để trở thành một câu hỏi hoàn toàn mới, hoặc thực sự là một số câu hỏi (hầu hết trong số đó đã được trả lời trên trang web của chúng tôi!) - 1. một phần của mô hình. 2. Không, đây là những sự thật chung về các bản phân phối. 3. Đúng là chúng không bình thường, tuy nhiên phần dư được sử dụng trong âm mưu QQ là phần dư sai lệch (được sinh viên nội bộ) - đặc biệt là trong trường hợp gamma - thường sẽ có xu hướng rất gần với phân phối thông thường (tôi đã viết một câu trả lời giải thích tại sao một số điểm) và nên có phương sai cơ bản không đổi. Một số sai lệch so với tính quy tắc không phải là bất ngờ nhưng độ lệch đáng kể ... ctd
Glen_b -Reinstate Monica

2
ctd ... từ tính quy tắc (giả sử các lô khác đều ổn) có thể chỉ ra một vấn đề với giả định phân phối.
Glen_b -Reinstate Monica
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.