Hệ số âm trong hồi quy logistic có trật tự


17

Giả sử chúng ta có phản hồi thứ tự và một bộ biến mà chúng ta nghĩ sẽ giải thích . Sau đó chúng tôi thực hiện một hồi quy logistic có trật tự của (ma trận thiết kế) trên (phản hồi).X : = [ x 1 , x 2 , x 3 ] y X yy:{Bad, Neutral, Good}{1,2,3}X:=[x1,x2,x3]yXy

Giả sử hệ số ước tính của , gọi nó là , trong hồi quy logistic theo thứ tự là . Làm cách nào để diễn giải tỷ lệ chênh (OR) của ?β 1 - 0,5 đ - 0,5 = 0,607x1β^10.5e0.5=0.607

Tôi có nói "với mức tăng 1 đơn vị trong , ceteris paribus, tỷ lệ quan sát là lần tỷ lệ quan sát và cho cùng một thay đổi trong , tỷ lệ quan sát là lần tỷ lệ quan sát "? Tốt 0,607 Xấu Trung tính x 1 Trung tính Tốt 0,607 Xấux1Good0.607BadNeutralx1NeutralGood0.607Bad

Tôi không thể tìm thấy bất kỳ ví dụ về giải thích hệ số tiêu cực trong sách giáo khoa hoặc Google.


2
Vâng, đó là chính xác. Nó gần giống với cách bạn diễn giải các hệ số dương.
Peter Flom - Tái lập Monica

2
NB: thông thường chúng ta nói "hồi quy y trên X ", không phải cách khác.
gung - Tái lập Monica

Câu trả lời:


25

Bạn đang đi đúng hướng, nhưng luôn luôn xem tài liệu của phần mềm bạn đang sử dụng để xem mô hình nào thực sự phù hợp. Giả sử một tình huống với một biến phụ thuộc phạm trù Y với các hạng mục đã ra lệnh 1,,g,,k và dự đoán X1,,Xj,,Xp .

"Trong tự nhiên", bạn có thể gặp ba lựa chọn tương đương để viết mô hình tỷ lệ cược theo tỷ lệ lý thuyết với các ý nghĩa tham số ngụ ý khác nhau:

  1. logit(p(Yg))=lnp(Yg)p(Y>g)=β0g+β1X1++βpXp(g=1,,k1)
  2. logit(p(Yg))=lnp(Yg)p(Y>g)=β0g(β1X1++βpXp)(g=1,,k1)
  3. logit(p(Yg))=lnp(Yg)p(Y<g)=β0g+β1X1++βpXp(g=2,,k)

(Mô hình 1 và 2 có hạn chế là trong các hồi quy logistic nhị phân riêng biệt , không thay đổi theo và , mô hình 3 có cùng hạn chế về và yêu cầu )β j g β 0 1 < ... < β 0 g < ... < β 0 k - 1 β j β 0 2 > ... > β 0 g > ... > β 0 kk1βjgβ01<<β0g<<β0k1βjβ02>>β0g>>β0k

  • Trong mô hình 1, một dương có nghĩa là rằng sự gia tăng dự đoán có liên quan đến tăng tỷ lệ cược cho một thấp hơn loại trong . X j YβjXjY
  • Mô hình 1 hơi phản trực giác, do đó mô hình 2 hoặc 3 dường như là mô hình được ưa thích trong phần mềm. Ở đây, một dương có nghĩa là rằng sự gia tăng dự đoán có liên quan đến tăng tỷ lệ cược cho một cao hơn loại trong . X j YβjXjY
  • Các mô hình 1 và 2 dẫn đến cùng một ước tính cho , nhưng các ước tính của chúng cho có các dấu hiệu trái ngược nhau. β jβ0gβj
  • Mô hình 2 và 3 dẫn đến cùng một ước tính cho , nhưng ước tính của chúng cho có các dấu hiệu trái ngược nhau. β 0 gβjβ0g

Giả sử phần mềm của bạn sử dụng mô hình 2 hoặc 3, bạn có thể nói "với mức tăng 1 đơn vị trong , ceteris paribus, tỷ lệ dự đoán của việc quan sát ' ' so với quan sát ' 'thay đổi theo hệ số . "và tương tự" với mức tăng 1 đơn vị trong , ceteris paribus, tỷ lệ dự đoán của việc quan sát' 'so với quan sát' 'thay đổi theo hệ số . " Lưu ý rằng trong trường hợp thực nghiệm, chúng tôi chỉ có tỷ lệ cược dự đoán, không phải tỷ lệ cược thực tế. Y = Tốt Y = Neutral HOẶC Bad e β 1 = 0,607 X 1 Y = Tốt HOẶC Neutral Y = Bad e β 1 = 0,607X1Y=GoodY=Neutral OR Badeβ^1=0.607X1Y=Good OR NeutralY=Badeβ^1=0.607

Dưới đây là một số minh họa bổ sung cho mô hình 1 với các loại . Đầu tiên, giả định của một mô hình tuyến tính cho các bản ghi tích lũy với tỷ lệ cược tỷ lệ thuận. Thứ hai, xác suất ngụ ý của việc quan sát ở hầu hết các loại . Các xác suất tuân theo các hàm logistic có cùng hình dạng. gk=4gnhập mô tả hình ảnh ở đây

Đối với bản thân xác suất danh mục, mô hình được mô tả ngụ ý các hàm được sắp xếp sau: nhập mô tả hình ảnh ở đây

Theo hiểu biết của tôi, mô hình 2 được sử dụng trong SPSS cũng như trong các hàm R MASS::polr()ordinal::clm(). Mô hình 3 được sử dụng trong các hàm R rms::lrm()VGAM::vglm(). Thật không may, tôi không biết về SAS và Stata.


@Harokitty Mô hình hồi quy logistic nhị phân không có thuật ngữ lỗi như mô hình hồi quy tuyến tính. Lưu ý rằng chúng ta đang mô hình hóa một xác suất, không phải chính biến phụ thuộc. Giả định về phân phối lỗi cho phải được chỉ định riêng, ví dụ: trong R với . Yglm(..., family=binomial)
caracal

Bạn có một tài liệu tham khảo liên quan đến cách thể hiện đặc tả số 2 trong danh sách 3 lựa chọn thay thế của bạn không?

1
@Harokitty Nó được mô tả ngắn gọn trong "Phân tích dữ liệu phân loại thông thường" của Agresti, phần 3.2.2, p49, phương trình 3.8 . Ngoài ra, trong "Phân tích dữ liệu phân loại" của Agresti, phần 9.4, p323, phương trình 9.12.
caracal

Xin chào, xin lỗi đã làm phiền bạn, bạn có tài liệu tham khảo cho người thứ 3 không? Agresti dường như không nói về điều đó.

2
logit(Y>g)logit(Yg)
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.