Hiểu hình dạng của khoảng tin cậy cho hồi quy đa thức (MLR)


11

Tôi gặp khó khăn để nắm bắt hình dạng của khoảng tin cậy của hồi quy đa thức.

Dưới đây là một ví dụ nhân Y^=a+bX+cX2 . Hình bên trái mô tả UPV (phương sai dự đoán không được tính toán) và biểu đồ bên phải hiển thị khoảng tin cậy và các điểm đo (nhân tạo) tại X = 1,5, X = 2 và X = 3.

Chi tiết về dữ liệu cơ bản:

  • bộ dữ liệu bao gồm ba điểm dữ liệu (1,5; 1), (2; 2,5) và (3; 2,5).

  • mỗi điểm được "đo" 10 lần và mỗi giá trị đo được thuộc về . Một MLR với mô hình poynomial đã được thực hiện trên 30 điểm kết quả.y±0.5

  • khoảng tin cậy được tính bằng các công thức và (cả hai công thức được lấy từ Myers, Montgomery, Anderson-Cook, "Phương pháp phản ứng bề mặt" phiên bản thứ tư, trang 407 và 34)

    UPV=Var[y^(x0)]σ^2=x0(XX)1x0
    y^(x0)tα/2,df(error)σ^2x0(XX)1x0
    μy|x0y^(x0)+tα/2,df(error)σ^2x0(XX)1x0.

tα/2,df(error)=2 và .σ^2=MSE=SSE/(np)0.075

Tôi không đặc biệt quan tâm đến các giá trị tuyệt đối của khoảng tin cậy, mà là hình dạng của UPV chỉ phụ thuộc vào .x0(XX)1x0

Hình 1: nhập mô tả hình ảnh ở đây

  • phương sai dự đoán rất cao bên ngoài không gian thiết kế là bình thường bởi vì chúng ta đang ngoại suy

  • nhưng tại sao phương sai nhỏ hơn giữa X = 1,5 và X = 2 so với các điểm đo được?

  • và tại sao phương sai trở nên rộng hơn đối với các giá trị trên X = 2 nhưng sau đó giảm dần sau X = 2.3 để trở lại nhỏ hơn so với điểm đo tại X = 3?

Sẽ không hợp lý khi phương sai là nhỏ trên các điểm đo và lớn giữa chúng?

Chỉnh sửa: cùng một quy trình nhưng với các điểm dữ liệu [(1.5; 1), (2.25; 2.5), (3; 2.5)] và [(1.5; 1), (2; 2.5), (2.5; 2.2), (3; 2,5)].

Hình 2: nhập mô tả hình ảnh ở đây

Hình 3: nhập mô tả hình ảnh ở đây

Điều thú vị cần lưu ý là trên hình 1 và 2, UPV trên Điểm chính xác bằng 1. Điều này có nghĩa là khoảng tin cậy sẽ chính xác bằng . Với số điểm tăng dần (hình 3), chúng ta có thể nhận được các giá trị UPV trên các điểm đo nhỏ hơn 1.y^±tα/2,df(error)MSE


2
Bạn có thể chỉnh sửa bài đăng của mình để bao gồm dữ liệu bạn làm việc không?
Stephan Kolassa

@StephanKolassa Tôi đã cố gắng giải thích những dữ liệu tôi đã sử dụng. Tuy nhiên, câu hỏi là nhiều hơn một cách chung chung và không bị ràng buộc với một ví dụ cụ thể.
John Tokka Tacos

Nếu bạn cung cấp dữ liệu, sẽ dễ dàng hơn để minh họa một câu trả lời.
Stephan Kolassa

Câu trả lời:


6

Hai cách chính để hiểu hiện tượng hồi quy như vậy là đại số --by thao tác các phương trình và công thức bình thường cho giải pháp của chúng - và hình học. Đại số, như minh họa trong chính câu hỏi, là tốt. Nhưng có một số công thức hình học hữu ích của hồi quy. Trong trường hợp này, hình dung dữ liệu trong không gian cung cấp cái nhìn sâu sắc( x , x 2 , y )(x,y)(x,x2,y) mà nếu không có thể khó khăn để đi qua.

Chúng ta phải trả giá khi cần phải nhìn vào các vật thể ba chiều, điều này rất khó thực hiện trên màn hình tĩnh. (Tôi thấy hình ảnh xoay vô tận gây khó chịu và vì vậy sẽ không gây ra bất kỳ hình ảnh nào cho bạn, mặc dù chúng có thể hữu ích.) Vì vậy, câu trả lời này có thể không hấp dẫn mọi người. Nhưng những người sẵn sàng thêm chiều thứ ba với trí tưởng tượng của họ sẽ được khen thưởng. Tôi đề nghị giúp bạn trong nỗ lực này bằng một số đồ họa được lựa chọn cẩn thận.


Hãy bắt đầu bằng cách hình dung các biến độc lập . Trong mô hình hồi quy bậc hai

(1)yi=β0+β1(xi)+β2(xi2)+error,

hai thuật ngữ và có thể khác nhau giữa các quan sát: chúng là các biến độc lập . Chúng ta có thể vẽ tất cả các cặp theo thứ tự( x 2 i )(xi)(xi2)(xi,xi2)xx2.(t,t2):

Hình 1

(x,x2)

Hình 2

Hồi quy bậc hai phù hợp với một mặt phẳng cho các điểm này.

(β0,β1,β2),(x,x2,y)(1)β1(x)β2(x2)+(1)yβ0,(β1,β2,1).β1=55/8β2=15/2,1,(x,x2) máy bay.)

Dưới đây là mặt phẳng hình vuông nhỏ nhất được trang bị cho các điểm sau:

nhập mô tả hình ảnh ở đây

y=f(x,x2),(t,t2)

t(t,t2,f(t,t2))

xyx2

hinh 4

(x,y^)y^x.

Dải tin cậy cho đường cong được trang bị này mô tả những gì có thể xảy ra với sự phù hợp khi các điểm dữ liệu được thay đổi ngẫu nhiên. Không thay đổi quan điểm, tôi đã vẽ năm mặt phẳng được trang bị (và các đường cong được nâng lên của chúng) thành năm bộ dữ liệu mới độc lập (trong đó chỉ có một mặt phẳng được hiển thị):

Hình 5

x1.75x3.

Chúng ta hãy nhìn vào điều tương tự bằng cách di chuột lên trên ô ba chiều và nhìn xuống dưới và dọc theo trục chéo của mặt phẳng. Để giúp bạn thấy các mặt phẳng thay đổi như thế nào, tôi cũng đã nén kích thước dọc.

Hình 6

(t,t2)(x,x2).

(xi,xi2)L(x,x2)(x,x2)(x,x2)L.

Hình 7

Lt(t,t2)Lx1.72.9

(x,y)


Phân tích này về mặt khái niệm áp dụng cho hồi quy đa thức mức độ cao hơn, cũng như cho hồi quy bội nói chung. Mặc dù chúng ta không thể thực sự "nhìn thấy" nhiều hơn ba chiều, toán học về hồi quy tuyến tính đảm bảo rằng trực giác xuất phát từ các ô hai và ba chiều của loại được hiển thị ở đây vẫn chính xác ở các chiều cao hơn.


Cảm ơn bạn cho câu trả lời tuyệt vời này! Nó chưa bao giờ xảy ra với tôi rằng hồi quy bậc hai phù hợp với một mặt phẳng tới các điểm. Những công thức hình học này thực sự trực quan, và đã giúp tôi rất nhiều.
John Tokka Tacos

1
Đây là một câu trả lời tuyệt vời - chúng ta nên tổng hợp các bài đăng hay nhất của bạn và biến chúng thành một cuốn sách nguồn mở
Xavier Bourret Sicotte

1
@Xavier Cảm ơn bạn vì những lời tốt đẹp. Tôi đã suy nghĩ về một cái gì đó như thế và hoan nghênh tất cả các đề xuất và phê bình mang tính xây dựng.
whuber

1

Trực giác

Trong một ý nghĩa rất trực quan và thô ráp, bạn có thể thấy đường cong đa thức khi hai đường cong tuyến tính được khâu lại với nhau (một tăng một giảm). Đối với các đường cong tuyến tính, bạn có thể nhớ hình dạng hẹp ở trung tâm .

Các điểm bên trái của đỉnh có ảnh hưởng tương đối ít đến các dự đoán ở bên phải của đỉnh và ngược lại.

  • Vì vậy, bạn có thể mong đợi hai vùng hẹp ở cả hai phía của đỉnh (trong đó những thay đổi về độ dốc của cả hai bên có tác dụng tương đối ít).

  • Vùng xung quanh đỉnh tương đối không chắc chắn hơn vì sự thay đổi độ dốc của đường cong có tác động lớn hơn ở vùng này. Bạn có thể vẽ nhiều đường cong với sự dịch chuyển lớn của đỉnh mà vẫn đi một cách hợp lý qua các điểm đo

Hình minh họa

Dưới đây là một minh họa với một số dữ liệu khác nhau, cho thấy dễ dàng hơn cách thức mẫu này (bạn có thể nói là một nút thắt đôi) có thể phát sinh:

hiển thị khoảng dự đoán với một nút thắt đôi

set.seed(1)
x <- c(rep(c(-6, -5, 6, 5), 5))
y <- 0.2*x^2 + rnorm(20, 0, 1)
plot(x, y, 
     ylim=c(-10,30), xlim=c(-10,10),
     pch=21, col=1, bg=1, cex=0.3)

data    = list(y=y,           x=x,                x2=x^2)
newdata = list(y=rep(0,3001), x=seq(-15,15,0.01), x2=seq(-15,15,0.01)^2  )

model <- lm(y~1+x+x2, data=data)
predictions = predict(model, newdata = newdata, interval="predict")
lines(newdata$x, predictions[,1])
lines(newdata$x, predictions[,2], lty=2)
lines(newdata$x, predictions[,3], lty=2)

Chính thức

x

x


1
Tôi đang gặp khó khăn khi tin vào đặc tính này hoặc bất kỳ kết luận nào của nó, bởi vì tôi khá chắc chắn rằng hồi quy bậc hai chỉ không hành xử theo cách này. Bạn có thể thuyết phục tôi bằng cách cung cấp một số biện minh cho họ?
whuber

1
Tôi đoán nó phụ thuộc vào vị trí của các điểm. Trong ví dụ, các điểm nằm ở cả hai phía của đỉnh. Sau đó, bạn có thể coi vị trí của đỉnh là một phép ngoại suy. Tôi sẽ làm một trường hợp ví dụ cực đoan hơn sau này. (Tôi cũng tự hỏi làm thế nào hồi quy được thực hiện, nhưng tôi tưởng tượng rằng lỗi trong các hệ số được coi là tương quan hoặc nếu không bạn thực sự không có được mô hình này)
Sextus Empiricus

(xi,xi2)xx2
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.