Giả định hồi quy đa biến logistic


Câu trả lời:


6

Giả định chính trong MNL là các lỗi được phân phối độc lập và giống hệt nhau với phân phối giá trị cực trị Gumbel. Vấn đề với việc kiểm tra giả định này là nó được tạo ra một tiên nghiệm . Trong hồi quy tiêu chuẩn, bạn khớp với đường cong bình phương nhỏ nhất và đo sai số dư. Trong mô hình logit, bạn giả sử rằng lỗi đã có trong phép đo điểm và tính toán hàm khả năng từ giả định đó.

Một giả định quan trọng là mẫu ngoại sinh. Nếu nó dựa trên sự lựa chọn, có những điều chỉnh cần được sử dụng.

Theo như các giả định về chính mô hình, Train mô tả ba:

  1. Hệ thống, và không ngẫu nhiên, biến đổi hương vị.
  2. Sự thay thế theo tỷ lệ giữa các lựa chọn thay thế (hậu quả của tài sản IIA).
  3. Không có mối tương quan nối tiếp trong thuật ngữ lỗi (dữ liệu bảng).

Giả định đầu tiên bạn chủ yếu chỉ phải bảo vệ trong bối cảnh vấn đề của bạn. Thứ ba là phần lớn giống nhau, bởi vì các điều khoản lỗi hoàn toàn ngẫu nhiên.

Thứ hai là có thể kiểm chứng ở một mức độ nhất định, tuy nhiên. Nếu bạn chỉ định mô hình logit lồng nhau và hóa ra mô hình thay thế liên tổ hoàn toàn linh hoạt ( ) thì bạn có thể đã sử dụng mô hình MNL và giả định IIA là hợp lệ. Nhưng hãy nhớ rằng hàm khả năng đăng nhập cho mô hình logit lồng nhau có cực đại cục bộ, vì vậy bạn nên đảm bảo rằng bạn nhận được một cách nhất quán.λ=1λ=1

Theo như bất kỳ điều gì trong SPSS, tôi không thể giúp bạn ngoài việc đề nghị bạn sử dụng mlogitgói trong R thay thế. Lấy làm tiếc.


Ngoài ra, mô hình probit đa cực cho đầu ra tương đương với một loạt các giả định khác nhau. Vì vậy, một so sánh MNP / MNL cũng có thể có giá trị.
gregmacfarlane

3

Một trong những giả định thực tế quan trọng nhất của logistic đa thức là số lượng quan sát trong loại tần số nhỏ nhất của là lớn, ví dụ 10 lần số lượng tham số từ phía bên phải của mô hình.Y


Nó chỉ ra rằng điều này không phải lúc nào cũng hoàn toàn đúng. Đã có một số (rất) công việc gần đây cho thấy các thông số phù hợp có thể được ước tính cho các lựa chọn thay thế mà bạn không bao giờ quan sát, miễn là bạn có một số thông tin ngoại sinh về tần suất dân số thực tế là gì. Nhưng điều này đòi hỏi một công cụ ước tính khác nhau, vì vậy nói chung bạn đúng.
gregmacfarlane

1
Âm thanh như một Bayesian trước đang được kêu gọi - không thể không đồng ý. Nhưng không có thông tin bên ngoài, logistic đa thức không giới hạn có rất nhiều tham số để ước tính.
Frank Harrell

2

gmacfarlane đã rất rõ ràng. Nhưng để chính xác hơn, và tôi giả sử bạn thực hiện phân tích mặt cắt ngang, giả định cốt lõi là IIA (tính độc lập của các lựa chọn thay thế không liên quan). Bạn không thể buộc dữ liệu của mình phù hợp với giả định IIA, bạn nên kiểm tra nó và hy vọng nó sẽ được thỏa mãn. Spss không thể xử lý kiểm tra cho đến năm 2010 chắc chắn. R tất nhiên làm điều đó, nhưng tôi có thể dễ dàng hơn cho bạn để di chuyển đến stata và thực hiện các bài kiểm tra IIA được cung cấp bởi các lệnh postimimation mlogit.

Nếu IIA không giữ, logit đa phương hoặc logit lồng nhau là những lựa chọn thay thế hợp lý. Cái đầu tiên có thể được ước tính trong gllamm, cái thứ hai với lệnh nlogit khó hiểu hơn nhiều.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.