Giải thích dự đoán biến đổi và / hoặc phản hồi


46

Tôi tự hỏi nếu nó làm cho một sự khác biệt trong việc giải thích cho dù chỉ phụ thuộc, cả phụ thuộc và độc lập, hoặc chỉ các biến độc lập được chuyển đổi nhật ký.

Hãy xem xét trường hợp

log(DV) = Intercept + B1*IV + Error 

Tôi có thể hiểu IV là phần trăm tăng nhưng điều này thay đổi như thế nào khi tôi có

log(DV) = Intercept + B1*log(IV) + Error

hoặc khi tôi có

DV = Intercept + B1*log(IV) + Error

?


1
Tôi có cảm giác cách giải thích "tăng phần trăm" là không đúng nhưng tôi không đủ nắm bắt để nói chính xác tại sao. Tôi hy vọng ai đó có thể giúp đỡ .... Ngoài ra, tôi khuyên bạn nên lập mô hình bằng cách sử dụng nhật ký nếu họ giúp thiết lập mối quan hệ XY tốt hơn, nhưng báo cáo các ví dụ được chọn về mối quan hệ đó bằng các biến ban đầu. Đặc biệt là nếu giao dịch với khán giả không quá am hiểu về kỹ thuật.
rolando2

3
@ rolando2: Tôi không đồng ý. Nếu một mô hình hợp lệ yêu cầu chuyển đổi, thì việc giải thích hợp lệ thường sẽ dựa vào các hệ số từ mô hình được chuyển đổi. Nó vẫn là trách nhiệm của điều tra viên để truyền đạt một cách thích hợp ý nghĩa của các hệ số đó đến khán giả. Tất nhiên, đó là lý do tại sao chúng tôi được trả nhiều tiền như vậy mà tiền lương phải được chuyển đổi ngay từ đầu.
jthetzel

1
@BigBucks: Chà, nhìn nó theo cách này. Giả sử khán giả của bạn không thể hiểu ý của bạn khi bạn giải thích rằng với mỗi thay đổi 1 trong nhật ký (cơ sở 10) của X, Y sẽ thay đổi theo b. Nhưng giả sử họ có thể hiểu 3 ví dụ sử dụng các giá trị X là 10, 100 và 1000. Tại thời điểm đó, họ có thể sẽ nắm bắt được bản chất phi tuyến của mối quan hệ. Bạn vẫn có thể báo cáo tổng thể, dựa trên b, nhưng đưa ra các ví dụ đó có thể tạo ra sự khác biệt.
rolando2

1
.... Mặc dù bây giờ tôi đã đọc lời giải thích tuyệt vời của bạn dưới đây, có lẽ việc sử dụng các "mẫu" đó có thể giúp rất nhiều người trong chúng ta làm sáng tỏ những vấn đề này trong sự hiểu biết.
rolando2

1
Người đọc ở đây cũng có thể muốn xem xét các chủ đề có liên quan chặt chẽ này: Làm thế nào để giải thích các hệ số biến đổi logarit trong hồi quy tuyến tính , và khi-và-tại-khi-lấy-log-of-a-phân phối-số .
gung - Phục hồi Monica

Câu trả lời:


42

Charlie cung cấp một lời giải thích tốt đẹp, chính xác. Trang web tính toán thống kê tại UCLA có một số ví dụ khác: http://www.ats.ucla.edu/stat/sas/faq/sas_interpret_log.htmlmhttp://www.ats.ucla.edu/stat/mult_pkg/ faq / chung / log_transformed_regression.htmlm

Chỉ để bổ sung cho câu trả lời của Charlie, dưới đây là những diễn giải cụ thể về các ví dụ của bạn. Như mọi khi, các giải thích hệ số cho rằng bạn có thể bảo vệ mô hình của mình, rằng chẩn đoán hồi quy là thỏa đáng và dữ liệu là từ một nghiên cứu hợp lệ.

Ví dụ A : Không có biến đổi

DV = Intercept + B1 * IV + Error 

"Tăng một đơn vị trong IV có liên quan đến B1tăng đơn vị ( ) trong DV."

Ví dụ B : Kết quả chuyển đổi

log(DV) = Intercept + B1 * IV + Error 

"Một đơn vị tăng IV có liên quan đến B1 * 100tăng ( ) phần trăm trong DV."

Ví dụ C : Phơi bày biến đổi

DV = Intercept + B1 * log(IV) + Error 

"Tăng một phần trăm trong IV có liên quan đến B1 / 100tăng đơn vị ( ) trong DV."

Ví dụ D : Kết quả được chuyển đổi và tiếp xúc được chuyển đổi

log(DV) = Intercept + B1 * log(IV) + Error 

"Tăng một phần trăm trong IV có liên quan đến B1tăng ( ) phần trăm trong DV."


1
Những diễn giải này có giữ bất kể cơ sở của logarit không?
Ayalew A.

Ví dụ B: Nhật ký chuyển đổi kết quả (DV) = Chặn + B1 * IV + Lỗi "Một đơn vị tăng IV được liên kết với mức tăng phần trăm (B1 * 100) trong DV Trong trường hợp này, bạn sẽ làm thế nào nếu bạn muốn tăng 30 Giảm DV? Cảm ơn câu trả lời của bạn
Antouria

Vì vậy, một bản ghi DV ~ B1 * (IV) là một mô hình tốt cho biến phụ thuộc liên tục không giới hạn?
Bakaburg

2
Tôi có thể bối rối. Nếu bạn đăng nhập biến đổi kết quả, bạn phải cộng lại hệ số để tìm sự khác biệt nhân. Giải thích nó trên thang đo log chỉ hoạt động như một xấp xỉ khi tỷ lệ này rất gần với 1.
AdamO

Liên kết bị hỏng.
Nick Cox

22

β1=log(y)log(x).
log(y)y=1y
log(y)=yy.
yx

β1yx

Theo cùng một logic, đối với mô hình nhật ký cấp, chúng ta có

β1=ylog(x)=100y100×log(x).
β1/100yx

log(y)=yy?

1
log(y)yyyy1y0yyy

7

Mục đích chính của hồi quy tuyến tính là ước tính sự khác biệt trung bình của các kết quả so sánh các mức liền kề của một hồi quy. Có nhiều loại phương tiện. Chúng ta quen thuộc nhất với ý nghĩa số học.

AM(X)=(X1+X2++Xn)n

AM là những gì được ước tính bằng cách sử dụng OLS và các biến chưa được dịch. Ý nghĩa hình học là khác nhau:

GM(X)=(X1×X2××Xn)n=exp(AM(log(X))

nhập mô tả hình ảnh ở đây

Thực tế, chênh lệch GM là chênh lệch nhân: bạn trả X% tiền lãi khi giả định khoản vay, nồng độ hemoglobin của bạn giảm X% sau khi bắt đầu metformin, tỷ lệ thất bại của lò xo tăng X% như một phần của chiều rộng. Trong tất cả các trường hợp này, một sự khác biệt trung bình thô có ý nghĩa ít hơn.

log(y) ~ xβ1Xeβ1

eβ1=0.40

log(x)1xXexp(0.05)1.05Xexp(0.5)=1.65YX

y ~ log(x, base=2)xXβ1

Cuối cùng, log(y) ~ log(x)đơn giản là áp dụng cả hai định nghĩa để có được sự khác biệt về số nhân so sánh các nhóm khác nhau theo cấp số nhân.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.