Tôi không biết nếu bạn có ý nghĩa chính xác điều này, nhưng tôi thấy rất nhiều người đề cập đến Chuẩn hóa dữ liệu có nghĩa là Chuẩn hóa dữ liệu. Tiêu chuẩn hóa đang chuyển đổi dữ liệu của bạn để nó có nghĩa là 0 và độ lệch chuẩn 1:
x <- (x - mean(x)) / sd(x)
Tôi cũng thấy mọi người sử dụng thuật ngữ Chuẩn hóa dữ liệu để nhân rộng dữ liệu, như khi chuyển đổi dữ liệu của bạn thành phạm vi 0-1:
x <- (x - min(x)) / (max(x) - min(x))
Nó có thể gây nhầm lẫn!
Cả hai kỹ thuật đều có ưu và nhược điểm của chúng. Khi nhân rộng một tập dữ liệu có quá nhiều ngoại lệ, dữ liệu không phải là ngoại lệ của bạn có thể kết thúc trong một khoảng rất nhỏ. Vì vậy, nếu tập dữ liệu của bạn có quá nhiều ngoại lệ, bạn có thể muốn xem xét Chuẩn hóa nó. Tuy nhiên, khi bạn làm điều đó, bạn sẽ kết thúc với dữ liệu âm (đôi khi bạn không muốn điều đó) và dữ liệu không bị ràng buộc (bạn cũng có thể không muốn điều đó).