Ý nghĩa trực quan của việc có mối quan hệ tuyến tính giữa các bản ghi của hai biến là gì?


20

Tôi có hai biến không thể hiện nhiều mối tương quan khi được vẽ với nhau, nhưng mối quan hệ tuyến tính rất rõ ràng khi tôi vẽ các bản ghi của từng biến một lần nữa.

Vì vậy, tôi sẽ kết thúc với một mô hình của loại:

log(Y)=alog(X)+b
, rất tuyệt vời về mặt toán học nhưng dường như không có giá trị giải thích của mô hình tuyến tính thông thường.

Làm thế nào tôi có thể giải thích một mô hình như vậy?


5
Tôi không có gì đáng kể để thêm vào các câu trả lời hiện có, nhưng một logarit trong kết quả và dự đoán là một độ co giãn. Tìm kiếm cho thuật ngữ đó sẽ tìm thấy một số tài nguyên tốt để diễn giải mối quan hệ đó, không trực quan lắm.
Upper_Case-Stop gây hại cho Monica

Việc giải thích mô hình log-log, trong đó biến phụ thuộc là log (y) và biến độc lập là log (x), là: x %Δ=β1%Δx.
Bob

3
Liên kết log-log bổ sung là một đặc điểm kỹ thuật GLM lý tưởng khi kết quả là nhị phân (mô hình rủi ro) và phơi nhiễm được tích lũy, chẳng hạn như số lượng bạn tình so với nhiễm HIV. jstor.org/ sóng / 2532454
AdamO

2
@Alexis bạn có thể thấy các điểm dính nếu bạn phủ các đường cong. Hãy thử curve(exp(-exp(x)), from=-5, to=5)vs curve(plogis(x), from=-5, to=5). Các concavity tăng tốc. Nếu rủi ro của sự kiện từ một lần gặp gỡ là p , thì rủi ro sau sự kiện thứ hai sẽ là 1(1p)2 , v.v., đó là một logit hình dạng xác suất sẽ không nắm bắt được. Phơi nhiễm cao sẽ làm lệch kết quả hồi quy logistic đáng kể hơn (sai theo quy tắc xác suất trước). Một số mô phỏng sẽ cho bạn thấy điều này.
AdamO

1
@AdamO Có lẽ có một bài viết sư phạm được viết kết hợp một mô phỏng như vậy thúc đẩy làm thế nào để chọn một liên kết phân đôi cụ thể trong số ba, bao gồm cả các tình huống mà nó làm và không tạo ra sự khác biệt.
Alexis

Câu trả lời:


27

Bạn chỉ cần lấy số mũ của cả hai mặt của phương trình và bạn sẽ có được mối quan hệ tiềm năng, điều đó có thể có ý nghĩa đối với một số dữ liệu.

log(Y)=alog(X)+b

exp(log(Y))=exp(alog(X)+b)

Y=ebXa

Và vì chỉ là một tham số có thể nhận bất kỳ giá trị dương nào, nên mô hình này tương đương với:eb

Y=cXa

Cần lưu ý rằng biểu thức mô hình nên bao gồm cụm từ lỗi và những thay đổi của các biến này có tác dụng thú vị đối với nó:

log(Y)=alog(X)+b+ϵ

Y=ebXaexp(ϵ)

Nghĩa là, mô hình của bạn có lỗi phụ gia tuân theo các điều kiện cho OLS (lỗi phân phối thông thường có phương sai không đổi) tương đương với mô hình tiềm năng có lỗi nhân với logaritm theo phân phối bình thường với phương sai không đổi.


3
OP có thể quan tâm khi biết rằng bản phân phối này có tên, log-normal: en.wikipedia.org/wiki/Log-n
normal_distribution

2
Còn ảnh hưởng của sự bất bình đẳng của Jensen thì sao? Nói chung đối với lồi g,E[g(X)]g(E[X])
Thống kê

14

Bạn có thể lấy mô hình và tính tổng vi phân, bạn sẽ kết thúc với một cái gì đó như: mang lại log(Y)=alog(X)+b

1YdY=a1XdX
dYdXXY=a

Do đó một giải thích đơn giản của hệ số sẽ là sự thay đổi phần trăm trong cho một sự thay đổi phần trăm trong . Điều này ngụ ý hơn nữa là biến tăng trưởng tại một hằng số phần ( ) của tốc độ tăng trưởng của .aYXYaX


Vì vậy, nếu biểu đồ log-log là tuyến tính, điều đó có nghĩa là tốc độ tăng trưởng không đổi?
Dimitriy V. Masterov

Không thực tế, tốc độ tăng trưởng của sẽ không đổi khi và chỉ khi . Ya=0
RScrlli

Không theo thời gian, tốc độ tăng trưởng liên quan đến sự tăng trưởng trong x.
Dimitriy V. Masterov

sắp xếp lại không giúp được gì, tôi sẽ xóa nó
Aksakal

1
@ DimitriyV.Masterov Ok, sau đó kể từ khi là tuyến tính trong nó có nghĩa là biến mọc ở một phần nhỏ liên tục tốc độ tăng trưởng của . Có điều gì sai với câu trả lời của tôi theo bạn? log(Y)log(X)YX
RScrlli

7

Theo trực giác cung cấp cho chúng ta thứ tự độ lớn của một biến, vì vậy chúng ta có thể xem mối quan hệ là thứ tự độ lớn của hai biến có liên quan tuyến tính. Ví dụ, việc tăng công cụ dự đoán theo một bậc độ lớn có thể liên quan đến việc tăng ba bậc độ lớn của phản ứng.log

Khi vẽ sơ đồ bằng cách sử dụng biểu đồ log-log, chúng tôi hy vọng sẽ thấy mối quan hệ tuyến tính. Sử dụng một ví dụ từ câu hỏi này , chúng ta có thể kiểm tra các giả định mô hình tuyến tính:

log-log


3
+1 cho câu trả lời trực quan cho một khái niệm không trực quan. Tuy nhiên, hình ảnh bạn đã đưa vào rõ ràng vi phạm phương sai lỗi liên tục trên bộ dự đoán.
Frans Rodenburg

1
Câu trả lời là đúng, nhưng quyền tác giả là sai. Hình ảnh không nên được quy cho Google Hình ảnh, nhưng, ít nhất, cho trang web nơi nó được tìm thấy, có thể được tìm thấy chỉ bằng cách nhấp vào hình ảnh của Google.
Pere

@Pere Tôi không thể tìm thấy nguồn gốc của hình ảnh một cách đáng tiếc (ít nhất là sử dụng tìm kiếm hình ảnh ngược)
qwr

Nó dường như xuất phát từ sơ đồ sơ đồ mặc dù trang web đó đã ngừng hoạt động và hầu hết các trang của nó không nằm trong Lưu trữ web ngoài trang chủ của nó
Henry

4

Điều chỉnh câu trả lời của @Rscrill với dữ liệu rời rạc thực tế, xem xét

log(Yt)=alog(Xt)+b,log(Yt1)=alog(Xt1)+b

log(Yt)log(Yt1)=a[log(Xt)log(Xt1)]

Nhưng

log(Yt)log(Yt1)=log(YtYt1)log(Yt1+ΔYtYt1)=log(1+ΔYtYt1)

ΔYtYt1 là phần trăm thay đổi của giữa các giai đoạn và hoặc tốc độ tăng trưởng của , giả sử . Khi nó nhỏ hơn , chúng ta có một xấp xỉ chấp nhận được làYt1tYtgYt0.1

log(1+ΔYtYt1)ΔYtYt1=gYt

Vì vậy, chúng tôi nhận được

gYtagXt

trong đó nghiên cứu thực nghiệm về điều trị lý thuyết của @Rscrill.


1
Đây có lẽ là điều mà một nhà toán học sẽ gọi là trực quan :)
Richard Hardy

2

Mối quan hệ tuyến tính giữa các bản ghi tương đương với sự phụ thuộc của luật công suất : Trong vật lý hành vi như vậy có nghĩa là hệ thống không có tỷ lệ hoặc bất biến tỷ lệ . Ví dụ, nếu là khoảng cách hoặc thời gian, điều này có nghĩa là sự phụ thuộc vào không thể được đặc trưng bởi một chiều dài hoặc thang thời gian đặc trưng (trái ngược với phân rã theo cấp số nhân). Kết quả là, một hệ thống như vậy thể hiện một sự phụ thuộc tầm xa của trên .

YXα
XXYX

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.