Làm cách nào tôi có thể sử dụng giá trị của


13

Các biểu đồ dưới đây là các sơ đồ phân tán dư của một bài kiểm tra hồi quy mà các giả định "tính đồng nhất", "tính đồng nhất" và "tính độc lập" đã được đáp ứng chắc chắn! Để kiểm tra giả định "tuyến tính" , mặc dù, bằng cách nhìn vào các biểu đồ, có thể đoán rằng mối quan hệ là đường cong, nhưng câu hỏi là: Làm thế nào có thể sử dụng giá trị cho "Tuyến tính R2" để kiểm tra giả định tuyến tính? Phạm vi chấp nhận được đối với giá trị của "R2 tuyến tính" để quyết định xem mối quan hệ có phải là tuyến tính không? Phải làm gì khi giả định tuyến tính không được đáp ứng và biến đổi IV cũng không giúp ích gì? !!

Đây là liên kết đến kết quả đầy đủ của bài kiểm tra.

Điểm phân tán:

nhập mô tả hình ảnh ở đây

nhập mô tả hình ảnh ở đây

nhập mô tả hình ảnh ở đây


3
Tôi thấy qua vẻ ngoài của các biểu đồ mà bạn đang sử dụng SPSS. Chỉ cần mở biểu đồ để chỉnh sửa và tìm "Thêm nút đường phù hợp" ở đó bạn sẽ tìm thấy một số tùy chọn vẽ đường thẳng phi tuyến , ví dụ Loess. Kiểm tra nếu tùy chọn này cung cấp cho bạn một đường thẳng hợp lý.
ttnphns

@ ttnphns: Tôi đã thêm cốt truyện với Loess dòng 2 câu hỏi.
Cyrus

Chà, nó có vẻ khá cong, phải không? Bạn có thể chơi nhiều hơn với các tham số Loess để xem điều gì sẽ xảy ra. Nếu đường cong bạn có thể kết luận trực quan mối quan hệ không phải là tuyến tính.
ttnphns

@Cyrus, tôi đã đăng câu trả lời chung cho câu hỏi này nhưng sẽ thêm một chút giải thích về cốt truyện của bạn và nhận ra rằng tôi không chắc chắn các trục y trong cốt truyện của bạn là gì - bạn có thể làm rõ không? xy
Macro

@ ttnphns: vâng, đó là đường cong. Tôi không biết làm thế nào để điều trị mô hình này! Trong thử nghiệm này (# 2) tôi có 2 IV ảnh hưởng trực tiếp đến DV (PIT). Kết quả hồi quy cho thấy chỉ có 1 trong số IV ảnh hưởng đáng kể đến DV. R2 rất thấp (0,172) và độ tuyến tính cũng thấp (ít nhất, theo biểu đồ, khi IV ở mức thấp). Tôi không biết thử nghiệm này có được chấp nhận hay không! Ngay cả tôi đã chuyển đổi cả IV (bằng cách tính LN của chúng) và chạy lại hồi quy, nhưng kết quả thậm chí còn tồi tệ hơn!
Cyrus

Câu trả lời:


15

Lưu ý rằng giả định tuyến tính mà bạn đang nói chỉ nói rằng giá trị trung bình có điều kiện của cho X i là hàm tuyến tínhYiXi . Bạn không thể sử dụng giá trị của để kiểm tra giả định này.R2

Điều này là do chỉ là mối tương quan bình phương giữa các giá trị được quan sát và dự đoán và giá trị của hệ số tương quan không xác định duy nhất mối quan hệ giữa XY (tuyến tính hoặc cách khác) và cả hai kịch bản sau đây đều có thể: R2XY

  • Cao nhưng giả thiết tuyến tính vẫn là sai trong một cách quan trọngR2

  • thấp nhưng giả định tuyến tính vẫn thỏa mãnR2

Tôi sẽ thảo luận lần lượt từng cái:

R2X1,...,Xn99%M1%

Yi={Ziif XiMMif Xi=M

ZiN(μ,1)Mμμ=0,M=105XiYi

u = runif(1e4)>.99
x = rnorm(1e4)
x[which(u==1)] = 1e5
y = rnorm(1e4)
y[which(x==1e5)] = 1e5
cor(x,y)
[1] 1

YiXiYiXiXi=M .

R2XiYi

Yi=β0+β1Xi+εi

YiXiXivar(εi)=σ2β1R2

x = rnorm(200)
y = 1 + 2*x + rnorm(200,sd=5)
cor(x,y)^2
[1] 0.1125698

R2

Re: Phải làm gì khi giả định tuyến tính không được đáp ứng và biến đổi IV cũng không giúp ích gì? !!

Khi phi tuyến tính là một vấn đề, có thể hữu ích khi xem xét các lô của phần dư so với từng yếu tố dự đoán - nếu có bất kỳ mẫu đáng chú ý nào, điều này có thể chỉ ra tính phi tuyến tính trong dự báo đó. Ví dụ, nếu âm mưu này cho thấy mối quan hệ "hình bát" giữa phần dư và yếu tố dự đoán, thì điều này có thể chỉ ra một thuật ngữ bậc hai bị thiếu trong yếu tố dự đoán đó. Các mẫu khác có thể chỉ ra một hình thức chức năng khác nhau. Trong một số trường hợp, có thể bạn chưa thử chuyển đổi đúng hoặc mô hình thực không tuyến tính trong bất kỳ phiên bản biến đổi nào của biến (mặc dù có thể tìm được xấp xỉ hợp lý).

R2


4

R2=11R2R221<x<2R2R2


Cảm ơn Michael. Cỡ mẫu của tôi là 302. Tôi sẽ đánh giá cao nếu bạn có thể xem kết quả kiểm tra ở đây và xem liệu nó có hợp lý và có thể báo cáo được không. TQ
Cyrus

@Cyrus Đây là một khó khăn. Dư lượng trông giống như họ thực sự phù hợp với bình thường thực sự tốt và không có gì tôi có thể thấy đó là sai với hồi quy tuyến tính. Bạn có một lượng dữ liệu kha khá. R vuông thấp vì thành phần nhiễu ngẫu nhiên lớn. Biểu đồ LOESS hiển thị một số độ cong ở các giá trị thấp hơn của biến độc lập. Nhưng tôi không thấy điều đó thuyết phục. Tôi nghĩ rằng nó cũng có thể là tuyến tính và nó cho thấy tại sao R vuông không phải là một chỉ số tốt trong trường hợp này.
Michael R. Chernick

Tq Michael :) Vâng, nó thực sự bối rối! Tất cả các giả định được đáp ứng hoàn hảo nhưng tuyến tính! Như bạn có thể thấy trong biểu đồ thứ 1 ở trên, R2 bậc hai (0.199) lớn hơn R2 tuyến tính (0.172) có nghĩa là nó có thể dự đoán mô hình tốt hơn. Trên thực tế khi tôi thực hiện hồi quy bậc hai (bằng cách thêm SC2), biểu đồ phân tán trong kết quả rất không đồng nhất! Tôi thấy bối rối! Không biết phải làm gì với mô hình này! Vấn đề duy nhất của nó là tính tuyến tính thấp. Tôi không biết làm thế nào để biện minh cho tính tuyến tính nếu tôi đặt biểu đồ phân tán trong báo cáo của mình. Hồi quy bậc hai cũng thất bại 2meet giả định đồng nhất. Trợ giúp
Cyrus

1
Tôi không nghĩ đó là sự bối rối. Nó trông khá tuyến tính. Có rất nhiều biến động đó là lý do tại sao R vuông thấp. Tôi nghĩ rằng cách duy nhất để bạn có thể làm giảm sự thay đổi sẽ là tìm biến giải thích anothe.
Michael R. Chernick
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.