Tôi hiểu khái niệm nhân rộng ma trận dữ liệu để sử dụng trong mô hình hồi quy tuyến tính. Ví dụ: trong R bạn có thể sử dụng:
scaled.data <- scale(data, scale=TRUE)
Câu hỏi duy nhất của tôi là, đối với các quan sát mới mà tôi muốn dự đoán các giá trị đầu ra, chúng được chia tỷ lệ chính xác như thế nào? Nó sẽ là , scaled.new <- (new - mean(data)) / std(data)
?
y = y_esc * sd(y) + mean(y)
, nhưng điều đó sẽ gây rối với các thuộc tính mô hình mà tôi đoán, vì vậy tôi cũng đang chờ câu trả lời kỹ thuật hơn!