Làm thế nào để mô hình tuyến tính tổng quát khái quát hóa mô hình tuyến tính tổng quát?


8

Từ Wikipedia

Mô hình tuyến tính tổng quát (GLM) là mô hình tuyến tính thống kê. Nó có thể được viết dưới dạng 1 trong đó là ma trận với một loạt các phép đo đa biến, là ma trận có thể là ma trận thiết kế , là ma trận chứa các tham số thường được ước tính và là ma trận chứa lỗi hoặc nhiễu. Các lỗi thường được giả định là tuân theo phân phối chuẩn nhiều biến số.Y X B U

Y=XB+U,
YXBU

Sau đó nó nói

Nếu các lỗi không tuân theo một phân phối chuẩn nhiều chiều, khái quát hóa mô hình tuyến tính có thể được sử dụng để thư giãn giả định về và .UYU

Tôi đã tự hỏi làm thế nào các mô hình tuyến tính tổng quát thư giãn các giả định về và trong các mô hình tuyến tính nói chung?UYU

Lưu ý rằng tôi có thể hiểu mối quan hệ khác của họ theo hướng ngược lại:

Mô hình tuyến tính tổng quát có thể được xem như là một trường hợp của mô hình tuyến tính tổng quát với liên kết nhận dạng.

Nhưng tôi nghi ngờ điều này sẽ giúp với câu hỏi của tôi.

Câu trả lời:


10

Hãy xem xét một trường hợp trong đó biến trả lời của bạn là một tập hợp 'thành công' và 'thất bại' (cũng được biểu thị dưới dạng 'yeses' và 'nos', s và s, v.v.). Nếu đây là sự thật, nó không thể là trường hợp mà bạn lỗi hạn được phân phối bình thường . Thay vào đó , theo định nghĩa , thuật ngữ lỗi của bạn sẽ là Bernoulli . Do đó, một trong những giả định được ám chỉ là bị vi phạm. Một giả định khác là về tính đồng nhất, nhưng điều này cũng sẽ bị vi phạm, bởi vì phương sai là một hàm của giá trị trung bình. Vì vậy, chúng ta có thể thấy rằng GLM (OLS) không phù hợp cho trường hợp này. 010

Lưu ý rằng, đối với mô hình hồi quy tuyến tính điển hình, những gì bạn dự đoán (nghĩa là ) là , giá trị trung bình của phân phối chuẩn có điều kiện của phản hồi tại điểm chính xác đó trong đó . Điều chúng ta cần trong trường hợp này là dự đoán , xác suất 'thành công' tại thời điểm đó. Vì vậy, chúng tôi nghĩ rằng phân phối phản hồi của chúng tôi là Bernoulli và chúng tôi dự đoán tham số kiểm soát hành vi của phân phối đó. Có một biến chứng quan trọng ở đây, tuy nhiên. Cụ thể, sẽ có một số giá trị cho , kết hợp với ước tính của bạn sẽ mang lại giá trị dự đoán của (nghĩa làμiX=xi π iXy^iμiX=xiπ^iXβy^iπ^i) sẽ là hoặc . Nhưng điều này là không thể, bởi vì phạm vi của là . Do đó, chúng ta cần chuyển đổi tham số để nó có thể phạm vi , giống như phía bên phải của GLiM của bạn có thể. Do đó, bạn cần một chức năng liên kết . <0>1π(0, 1)π(, )

Tại thời điểm này, chúng tôi đã quy định phân phối phản hồi (Bernoulli) và chức năng liên kết (có lẽ là chuyển đổi logit ). Chúng tôi đã có một phần cấu trúc của mô hình của mình: . Vì vậy, bây giờ chúng tôi có tất cả các phần cần thiết của mô hình của chúng tôi. Bây giờ đây là mô hình tuyến tính tổng quát, bởi vì chúng tôi đã 'nới lỏng' các giả định về biến trả lời của chúng tôi và các lỗi. Xβ

Để trả lời các câu hỏi cụ thể của bạn trực tiếp hơn, mô hình tuyến tính tổng quát làm giảm các giả định về và bằng cách đặt phân phối phản hồi (trong họ hàm mũ ) và hàm liên kết ánh xạ tham số được đề cập đến khoảng . YU(, )

Để biết thêm về chủ đề này, nó có thể giúp bạn đọc câu trả lời của tôi cho câu hỏi này: Sự khác biệt giữa mô hình logit và probit .


(+1) Câu trả lời ngắn gọn và dễ hiểu.
COOLSerdash

Cảm ơn, gung! Trong các mô hình tuyến tính nói chung, "các lỗi thường được giả định là tuân theo phân phối chuẩn nhiều biến số". Có đúng không khi các mô hình tuyến tính nói chung không nhất thiết phải là tham số theo nghĩa là chúng không chỉ định đầy đủ hình thức phân phối của Y cho X? Bởi vì một mô hình tuyến tính tổng quát luôn xác định phân phối của Y đã cho X là phân phối gia đình theo hàm mũ, có đúng là một mô hình tuyến tính tổng quát có thể không phải là mô hình tuyến tính tổng quát không?
Tim

Không, mô hình tuyến tính nói chung được chỉ định đầy đủ; nó luôn luôn là một trường hợp đặc biệt của mô hình tuyến tính tổng quát.
gung - Phục hồi Monica

Có phải "các lỗi thường được giả định là tuân theo phân phối chuẩn nhiều biến số" trong WIkipedia cho mô hình tuyến tính chung có nghĩa là lỗi có thể không được phân phối bình thường?
Tim
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.