Mô hình tuyến tính tổng quát so với mô hình tuyến tính tổng quát (có chức năng liên kết nhận dạng?)


25

Đây là bài viết đầu tiên của tôi, vì vậy xin hãy bình tĩnh nếu tôi không tuân theo một số tiêu chuẩn! Tôi đã tìm kiếm câu hỏi của tôi và không có gì đưa ra.

Câu hỏi của tôi chủ yếu liên quan đến sự khác biệt thực tế giữa mô hình tuyến tính tổng quát (GLM) và mô hình tuyến tính tổng quát (GZLM). Trong trường hợp của tôi, đó sẽ là một vài biến liên tục dưới dạng hiệp biến và một vài yếu tố trong ANCOVA, so với GZLM. Tôi muốn kiểm tra các tác động chính của từng biến, cũng như một tương tác ba chiều mà tôi sẽ phác thảo trong mô hình. Tôi có thể thấy giả thuyết này đang được thử nghiệm trong ANCOVA hoặc sử dụng GZLM. Ở một mức độ nào đó, tôi hiểu các quy trình toán học và lý do đằng sau việc chạy một mô hình tuyến tính chung như ANCOVA và tôi phần nào hiểu rằng GZLM cho phép một hàm liên kết kết nối mô hình tuyến tính và biến phụ thuộc (ok, tôi đã nói dối, có lẽ tôi không thực sự hiểu toán). Những gì tôi thực sự không ' Chúng tôi hiểu sự khác biệt hoặc lý do thực tế để chạy một phân tích và không phải là khác khi phân phối xác suất được sử dụng trong GZLM là bình thường (nghĩa là chức năng liên kết nhận dạng?). Tôi nhận được kết quả rất khác nhau khi tôi chạy cái khác. Tôi có thể chạy không? Dữ liệu của tôi hơi bất thường, nhưng hoạt động ở một mức độ nào đó cả trong ANCOVA và GZLM. Trong cả hai trường hợp, giả thuyết của tôi đều được hỗ trợ, nhưng trong GZLM, giá trị p là "tốt hơn".

Tôi nghĩ rằng ANCOVA là một mô hình tuyến tính với biến phụ thuộc được phân phối bình thường bằng cách sử dụng chức năng liên kết nhận dạng, đó chính xác là những gì tôi có thể nhập vào trong GZLM, nhưng chúng vẫn khác nhau.

Xin hãy làm sáng tỏ những câu hỏi này cho tôi, nếu bạn có thể!


Dựa trên câu trả lời đầu tiên tôi có câu hỏi bổ sung:

Nếu chúng giống hệt nhau ngoại trừ thử nghiệm quan trọng mà nó sử dụng (nghĩa là thử nghiệm F so với Quảng trường Wald Chi), cái nào sẽ thích hợp nhất để sử dụng? ANCOVA là "phương pháp đi đến", nhưng tôi không chắc tại sao thử nghiệm F lại thích hợp hơn. Ai đó có thể làm sáng tỏ câu hỏi này cho tôi? Cảm ơn!


Câu trả lời của @ onestop là tốt; Tôi đã nâng cấp nó từ lâu. Để hiểu rõ hơn về mối liên hệ giữa mô hình tuyến tính tổng quát và mô hình tuyến tính tổng quát , nó có thể giúp bạn đọc câu trả lời của tôi ở đây: mô hình khác biệt giữa logit-và-probit (mặc dù nó được viết trong một ngữ cảnh khác) . Giả sử lỗi của bạn được phân phối bình thường, nhưng phương sai lỗi không được biết là a-prori, các thử nghiệm & mà phần mềm sẽ trả về w / ANCOVA sẽ chính xác; giá trị p từ bài kiểm tra Wald sẽ quá thấp, trừ khi N của bạn rất lớn. tF
gung - Phục hồi Monica

Câu trả lời:


23

Một mô hình tuyến tính tổng quát chỉ định chức năng liên kết nhận dạng và phân phối gia đình bình thường hoàn toàn tương đương với mô hình tuyến tính (chung). Nếu bạn nhận được kết quả khác nhau rõ rệt từ mỗi kết quả, bạn đang làm sai điều gì đó.

Lưu ý rằng việc chỉ định một liên kết nhận dạng không giống như chỉ định phân phối bình thường.

Một số gói phần mềm có thể báo cáo các giá trị khác nhau đáng chú ý khi mức độ tự do còn lại là nhỏ nếu nó tính toán các giá trị này bằng cách sử dụng các phân phối bình thường và bình phương tiệm cận cho tất cả các mô hình tuyến tính tổng quát. Tất cả các phần mềm sẽ báo cáo -values dựa trên sinh viên - và Fisher -distributions cho các mô hình tuyến tính tổng quát, vì đây là chính xác hơn cho độ dư nhỏ của tự do khi họ không dựa vào asymptotics. Sinh viên - và phân phối của Fisher chỉ có giá trị cho gia đình bình thường, mặc dù một số khácpptFtF phần mềm cho các mô hình tuyến tính tổng quát cũng có thể sử dụng các giá trị này gần đúng khi phù hợp với các họ khác với tham số tỷ lệ được ước tính từ dữ liệu.


Cảm ơn bạn đã trả lời của bạn! Tôi rất vui khi nghe câu trả lời của bạn, vì đó là giả định ban đầu của tôi. Tôi đã được một giáo sư tại tổ chức của tôi nói khác, vì vậy tôi thực sự phải đi đào. Tôi đang sử dụng SPSS và bây giờ tôi thấy rằng các ước tính tham số thực sự giống hệt nhau (ví dụ: giá trị B). Bây giờ tôi thấy rằng những gì đã làm tôi bối rối ban đầu là các giá trị p khác nhau. Thống kê ANCOVA dựa trên thử nghiệm F tiêu chuẩn, trong khi GZLM dựa trên Wald Chi-Square, đúng không? Tôi đã đọc rằng Wald Chi-Square được sử dụng khi bạn sử dụng các tham số của mẫu (chẳng hạn như trong GZLM).
Behacad

Dựa trên câu trả lời này, tôi đã thêm một câu hỏi vào bài viết gốc!
Behacad

Ok, tôi đã thêm một đoạn tương ứng vào câu trả lời của tôi.
vào

5

Tôi muốn bao gồm kinh nghiệm của tôi trong cuộc thảo luận này. Tôi đã thấy rằng một mô hình tuyến tính tổng quát (chỉ định hàm liên kết nhận dạng và phân phối gia đình bình thường) giống hệt với mô hình tuyến tính chung chỉ khi bạn sử dụng ước tính khả năng tối đa làm phương pháp tham số tỷ lệ. Mặt khác, nếu "giá trị cố định = 1" được chọn làm phương thức tham số tỷ lệ, bạn sẽ nhận được các giá trị p rất khác nhau. Kinh nghiệm của tôi cho thấy thường nên tránh "giá trị cố định = 1". Tôi tò mò muốn biết liệu ai đó biết khi nào thì phù hợp để chọn giá trị cố định = 1 làm phương pháp tham số tỷ lệ. Cảm ơn trước. dấu


3
Thông thường, người ta chỉ sử dụng thang đo cố định với các mô hình như hồi quy logistic hoặc hồi quy Poisson, trong đó đáp ứng là biến đếm hoặc chỉ số / tần số. Trong trường hợp này, không có sự tương tự với tham số tỷ lệ trong hồi quy bình thường.
Hồng Ooi
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.