logit - giải thích các hệ số là xác suất


9

Tôi dường như đang thiếu một số thông tin quan trọng. Tôi biết rằng hệ số hồi quy logistic nằm trong log (tỷ lệ cược), được gọi là thang đo logit. Do đó, để giải thích chúng, exp(coef)được thực hiện và mang lại HOẶC tỷ lệ cược.

Nếu thì cách hiểu như sau: Đối với một đơn vị tăng trong hiệp phương sai , tỷ lệ chênh lệch log là 0,012 - không cung cấp thông tin có ý nghĩa như hiện tại.β1=0.012X1

Kết quả lũy thừa cho phép tăng một đơn vị trong hiệp phương sai , tỷ lệ chênh lệch là 1.012 ( ) hoặc nhiều hơn 1,012 so với .X1exp(0.012)=1.012Y=1Y=0

Nhưng tôi muốn thể hiện hệ số theo tỷ lệ phần trăm. Theo Gelman và Hill trong Phân tích dữ liệu bằng cách sử dụng mô hình hồi quy và đa cấp / phân cấp , trang 111:

Các hệ số có thể được lũy thừa và được coi là hiệu ứng nhân. "

Như vậy, nếu β1 = 0,012, thì "mức tăng nhân dự kiến ​​là exp (0,012) = 1,012, hoặc chênh lệch dương 1,2% ...

Tuy nhiên, theo kịch bản của tôi

ODDS=p1p

và công thức logit nghịch đảo

P=OR1+OR=1.0122.012=0.502

Điều mà tôi muốn giải thích là nếu hiệp phương sai tăng thêm một đơn vị thì xác suất Y = 1 tăng 50% - điều mà tôi cho là sai, nhưng tôi không hiểu tại sao.

Làm thế nào các hệ số logit có thể được giải thích theo xác suất?


(1) Bạn dường như đưa ra tỷ lệ cược và tỷ lệ cược: chúng là những thứ khác nhau. (2) Hãy cẩn thận một chút với số học của bạn. Bạn đang xử lý các thay đổi nhỏ, vì vậy bạn cần có độ chính xác đủ để thể hiện chúng. Đối với 1.012 / 2.012 tôi nhận được 0,5030 (đến bốn con số có ý nghĩa), trong đó - như một thay đổi tương đối so với 0,50 - lớn hơn 50% so với số của bạn! (3) Chúng tôi có một số chủ đề tốt về diễn giải các hệ số hồi quy logistic và OR. Tại sao bạn không tìm kiếm chúng và kiểm tra chúng?
whuber

1
@whuber cảm ơn bạn. Tôi đã tìm kiếm thêm một số và tìm thấy câu trả lời. Tôi đã tóm tắt phát hiện của tôi trong câu trả lời dưới đây. Hy vọng nó cũng sẽ hữu ích cho một số người dùng khác!
dùng1607

Câu trả lời:


14

Các tỷ lệ cược này là số mũ của hệ số hồi quy tương ứng:

odds ratio=eβ^

Ví dụ: nếu hệ số hồi quy logistic là thì tỷ lệ chênh lệch là .β^=0.25e0.25=1.28

Tỷ lệ cược là hệ số nhân cho thấy tỷ lệ cược thay đổi khi tăng một đơn vị giá trị của X. Tỷ lệ chênh lệch tăng theo hệ số 1,28. Vì vậy, nếu tỷ lệ cược ban đầu là 0,25, tỷ lệ chênh lệch sau khi tăng một đơn vị trong hiệp phương sai sẽ trở thành .0.25×1.28

Một cách khác để cố gắng diễn giải tỷ lệ cược là nhìn vào phần phân số và diễn giải nó dưới dạng phần trăm thay đổi. Ví dụ: tỷ lệ cược 1,28 tương ứng với mức tăng 28% về tỷ lệ cược cho mức tăng 1 đơn vị trong X tương ứng.

Trong trường hợp chúng tôi đang xử lý hiệu ứng giảm (OR <1), ví dụ tỷ lệ chênh lệch = 0,94, thì tỷ lệ cược giảm 6% cho mức tăng 1 đơn vị trong X tương ứng.

Công thức là:

Percent Change in the Odds=(Odds Ratio1)×100

+1: giải thích tốt.
whuber

@ user1607 điều này có ý nghĩa. Tuy nhiên, tôi không thấy cách nó trả lời câu hỏi liên quan đến việc logit nghịch đảo để có xác suất là cách chính xác hay không?
Blade Runner

7

Một phần của vấn đề là bạn đang lấy một câu từ Gelman và Hill ra khỏi bối cảnh. Đây là ảnh chụp màn hình sách của Google:

nhập mô tả hình ảnh ở đây

Lưu ý rằng tiêu đề nói "Giải thích các hệ số hồi quy Poisson " (nhấn mạnh thêm). Hồi quy Poisson sử dụng một liên kết logarit, trái ngược với hồi quy logistic, sử dụng liên kết logit (log-odds). Việc giải thích các hệ số lũy thừa là hiệu ứng nhân chỉ có tác dụng đối với hệ số quy mô log (hoặc, có nguy cơ làm vấy bẩn vùng nước một chút, đối với hệ số quy mô logit nếu rủi ro cơ bản là rất thấp ...)

Mọi người đều muốn có thể trích dẫn hiệu quả của các phương pháp điều trị đối với xác suất theo cách đơn giản, không phụ thuộc vào quy mô phổ quát, nhưng điều này về cơ bản là không thể: đây là lý do tại sao có rất nhiều hướng dẫn về diễn giải tỷ lệ cược và tỷ lệ cược lưu hành trong tự nhiên, và tại sao các nhà dịch tễ học dành quá nhiều thời gian để tranh luận về rủi ro tương đối so với tỷ lệ cược so với ...


4

Nếu bạn muốn diễn giải theo tỷ lệ phần trăm, thì bạn cần chặn y ( ). Lấy số mũ của hàm chặn cho tỷ lệ cược khi tất cả các hiệp phương sai là 0, sau đó bạn có thể nhân với tỷ lệ cược của một thuật ngữ nhất định để xác định tỷ lệ cược sẽ là bao nhiêu khi hiệp phương sai đó là 1 thay vì 0. β0

Biến đổi logit nghịch đảo ở trên có thể được áp dụng cho tỷ lệ cược để cho tỷ lệ phần trăm của .Y=1

Vì vậy, khi tất cả :x=0

p(Y=1)=eβ01+eβ0

và nếu (và bất kỳ hiệp phương sai nào khác là 0) thì:x1=1

p(Y=1)=e(β0+β1)1+e(β0+β1)

và những người có thể được so sánh. Nhưng lưu ý rằng hiệu ứng của là khác nhau tùy thuộc vào , nó không phải là hiệu ứng không đổi như trong hồi quy tuyến tính, chỉ không đổi trên thang tỷ lệ cược log.x1β0

Cũng lưu ý rằng ước tính của bạn về sẽ phụ thuộc vào cách dữ liệu được thu thập. Một nghiên cứu kiểm soát trường hợp trong đó số lượng đối tượng bằng nhau với và được chọn, thì giá trị của chúng được quan sát có thể đưa ra ước tính rất khác so với mẫu ngẫu nhiên đơn giản và giải thích tỷ lệ phần trăm ) từ cái đầu tiên có thể là vô nghĩa như những diễn giải về những gì sẽ xảy ra trong trường hợp thứ hai.β0Y=0Y=1xβ0

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.