Tôi đã cố gắng tái tạo kết quả cho "Giá nhà ở Hedonic và nhu cầu về không khí sạch" nhưng không có kết quả. Trong bảng 7 có ba hồi quy được đề cập bằng cách sử dụng bộ dữ liệu Boston, điều này được tìm thấy ở đây và trong gói MASS R.
Tôi đã kiểm tra các phương tiện và độ lệch đứng được báo cáo so với những dữ liệu trong dữ liệu và đã có kết quả chính xác (mặc dù một số biến như lstat, nox và medv cần một số ánh xạ). Tôi không thể chỉ ra chính xác rằng độ lệch trung bình và độ lệch chuẩn của màu đen, do ánh xạ biến của anh ta là (x - 0,63) ^ 2, trong tập dữ liệu này được nhân với 1000.
Hơn nữa, tôi không thể tái tạo kết quả của hồi quy. Sử dụng cả rlm và lm trong R, các hệ số luôn được tắt.
Đây là một bài báo khá quan trọng và một bộ dữ liệu đã được sử dụng khá rộng rãi, vì vậy sẽ rất ngạc nhiên nếu lỗi không phải là của tôi. Nhưng sẽ rất tuyệt nếu thấy ai khác có thể tái tạo điều này trong R hoặc ở nơi khác.
Vui lòng tìm mã R của tôi dưới đây:
# Load MASS for rlm and Boston
library(MASS)
# Sort into the correct order
data <- Boston[,c("medv","rm","age","black","lstat","crim","zn","indus","tax", "ptratio", "dis","rad","nox")]
# Creating a copy of table 5
rbind(sapply(data, mean),sapply(data, sd))
# Creating a copy of table 6
cov(data)
# Attempt to reverse engineer black variable
mean(-sqrt(Boston$black/1000)+0.63)
# Setting out the structural form
form <- formula(I(log(medv*1000)) ~ I(rm^2) + age + log(dis) + log(rad) + tax + ptratio + I(black/1000) + I((lstat/100)) + crim + zn + indus + chas + I((nox*10)^2))
# Regressing using rlm
rlm(form, data = Boston)
# Regressing using lm
lm(form, data = Boston)
# Comparing to referenced data set to check that
alternate <- read.table("https://archive.ics.uci.edu/ml/machine-learning-databases/housing/housing.data")
as.matrix(Boston) - as.matrix(alternate)