Quay lại biến đổi kết quả hồi quy khi lập mô hình nhật ký (y)


11

Tôi đang điều chỉnh hồi quy trên . Có hợp lệ để quay lại ước tính điểm biến đổi (và khoảng tin cậy / dự đoán) bằng phép lũy thừa không? Tôi không tin như vậy, vì nhưng muốn có ý kiến ​​khác.E [ f ( X ) ] f ( E [ X ] )log(y)E[f(X)]f(E[X])

Ví dụ của tôi dưới đây cho thấy xung đột với chuyển đổi ngược (.239 so với .219).

set.seed(123)

a=-5
b=2

x=runif(100,0,1)
y=exp(a*x+b+rnorm(100,0,.2))
# plot(x,y)

### NLS Fit
f <- function(x,a,b) {exp(a*x+b)} 
fit <- nls(y ~ exp(a*x+b),  start = c(a=-10, b=15)) 
co=coef(fit)
# curve(f(x=x, a=co[1], b=co[2]), add = TRUE,col=2,lwd=1.2) 
predict(fit,newdata=data.frame(x=.7))
[1] 0.2393773

### LM Fit
# plot(x,log(y))
# abline(lm(log(y)~x),col=2)
fit=lm(log(y)~x)
temp=predict(fit,newdata=data.frame(x=.7),interval='prediction')
exp(temp)
        fit       lwr       upr
1 0.2199471 0.1492762 0.3240752

1
Đây có phải là một trong những vấn đề được giải quyết bằng GLM gaussian liên kết không?
generic_user

@ARM Có tôi tin là vậy. Cảm ơn đã chỉ ra rằng. Tuy nhiên, sử dụng GLM sẽ khó có được các khoảng dự đoán hơn nhưng tôi nghĩ tôi có thể giải quyết được.
Glen

1
@Glen Thực hiện tìm kiếm cho Duan bôi nhọ trên trang web này.
Dimitriy V. Masterov

Câu trả lời:


13

Nó phụ thuộc vào những gì bạn muốn có được ở đầu kia.

Một khoảng tin cậy cho một tham số được chuyển đổi sẽ biến đổi tốt. Nếu nó có độ bao phủ danh nghĩa trên thang đo log, nó sẽ có cùng độ bao phủ trở lại trên thang đo ban đầu, vì tính đơn điệu của phép biến đổi.

Một khoảng dự đoán cho một quan sát trong tương lai cũng biến đổi tốt.

Một khoảng cho một giá trị trung bình trên thang đo log sẽ không phải là một khoảng thích hợp cho giá trị trung bình trên thang đo ban đầu.

Tuy nhiên, đôi khi bạn có thể chính xác hoặc xấp xỉ tạo ra một ước tính hợp lý cho giá trị trung bình trên thang đo ban đầu từ mô hình trên thang đo nhật ký.

Tuy nhiên, cần phải cẩn thận hoặc cuối cùng bạn có thể tạo ra các ước tính có các tính chất hơi đáng ngạc nhiên (có thể tạo ra các ước tính mà bản thân chúng không có ý nghĩa dân số; đây không phải là ý tưởng tốt của mọi người).

Vì vậy, ví dụ, trong trường hợp logic, khi bạn lũy thừa trở lại, bạn có một ước tính tốt về và bạn có thể lưu ý rằng dân số có nghĩa là , vì vậy bạn có thể nghĩ đến việc cải thiện bằng cách nhân rộng nó bằng một số ước tính của .exp(μi)exp(μi+12σ2)exp(μi^)exp(12σ2)

Ít nhất người ta phải có thể có được ước tính nhất quán và thực sự một số tiệm cận phân phối thông qua định lý Slutsky (cụ thể là dạng sản phẩm) miễn là người ta có thể ước lượng nhất quán sự điều chỉnh. Định lý ánh xạ liên tục nói rằng bạn có thể nếu bạn có thể ước tính một cách nhất quán ... đó là trường hợp.σ2

Vì vậy, miễn là là một công cụ ước tính nhất quán của , thì hội tụ trong phân phối cho phân phối (mà sau đó kiểm tra sẽ được phân phối một cách bất hợp lý ). Vì sẽ phù hợp với , vì định lý ánh xạ liên tục, sẽ phù hợp với và vì vậy chúng tôi có một ước lượng nhất quán của có nghĩa là trên quy mô ban đầu.σ^2σ2exp(μi^)exp(12σ^2) ^ μ i μiexp( ^ μ i )exp(μi)exp(μi^)exp(12σ2)μi^μiexp(μi^)exp(μi)

Xem ở đây .

Một số bài viết liên quan:

Chuyển đổi ngược của mô hình MLR

Chuyển đổi trở lại

Khoảng tin cậy được chuyển đổi ngược


1
Cảm ơn, tôi đã xem các bài viết trước và, trong khi khai sáng, vẫn còn hơi bối rối, do đó câu hỏi của tôi.
Glen

+1 Câu trả lời tuyệt vời! Chỉ cần làm rõ một cách nhanh chóng: đến từ đâu như một công cụ thu nhỏ cho ? Tôi đã thấy nó trong định nghĩa về logic bất thường trong Wikipedia nhưng nó cũng không được giải thích ở đó, có phải nó chỉ tích hợp ngoài ý nghĩa từ PDF không? ^ σ 212σ2^
usεr11852

1
Bạn sẽ có thể có được nó chỉ bằng cách tích hợp trực tiếp: trong đó là mật độ cho lognatural, nhưng có lẽ dễ thực hiện hơn bằng cách tính toán cho một bình thường (trong đó ), nhưng có lẽ tốt hơn là tìm MGF cho - điều này không còn khó khăn nữa - và từ đó, những khoảnh khắc cho rất dễ dàng có được (bằng cách thay thế bởi lần lượt), về cơ bản nhận được những khoảnh khắc cao miễn phí. f E ( e X ) X = log Y X Y t 1 , 2 , . . .E(Y)=0yf(y)dyfE(eX)X=logYXYt1,2,...
Glen_b -Reinstate Monica

1
@ usεr11852 Trong một trong các trường hợp sau, bạn đưa hoặc vào thuật ngữ trong mật độ, sau đó hoàn thành hình vuông theo và mang các hằng số bổ sung (tức là tất cả ngoại trừ bình thường hóa hằng số cho bình thường) ở phía trước tích phân (có trong đó), để lại một pdf Gaussian được tích hợp trên dòng thực (với giá trị trung bình thay đổi từ bản gốc) tích hợp thành 1, chỉ để lại các hằng số bạn mang theo ra phía trước Điều này không liên quan gì nhiều đến các thao tác đại số rất đơn giản, ... ctde t x e . . . xexetxe...x12
Glen_b -Reinstate Monica

1
ctd ... và từ đó thời điểm thô thứ của một logic bất thường là . e μ t + 1teμt+12σ2t2
Glen_b -Reinstate Monica
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.