Một số tình huống khi bình thường hóa dữ liệu đầu vào có nghĩa là không, phương sai đơn vị là không phù hợp hoặc không có lợi?


7

Tôi đã thấy bình thường hóa dữ liệu đầu vào có nghĩa là không, phương sai đơn vị nhiều lần trong học máy. Đây có phải là một thực hành tốt để được thực hiện tất cả các thời gian hoặc có những lúc nó không phù hợp hoặc không có lợi?

Câu trả lời:


6

Một câu trả lời chi tiết cho câu hỏi có thể được tìm thấy ở đây .

[...] Có những lúc nó không phù hợp hay không có lợi?

Câu trả lời ngắn: Có và Không trong các điều khoản, rằng nó có thể thay đổi đáng kể đầu ra của bạn, ví dụ như thuật toán phân cụm. Không , mặt khác, nếu những thay đổi này là những gì bạn muốn đạt được. Hoặc để đặt nó trong các từ của tác giả của nguồn được đề cập:

Các tính năng mở rộng cho các thuật toán phân cụm có thể thay đổi đáng kể kết quả. Hãy tưởng tượng bốn cụm xung quanh nguồn gốc, mỗi cụm trong một góc phần tư khác nhau, tất cả đều được chia tỷ lệ độc đáo. Bây giờ, hãy tưởng tượng trục y được kéo dài gấp mười lần chiều dài của trục x. thay vì bốn cụm góc phần tư nhỏ, bạn sẽ có được một baguette dữ liệu dài bị băm nhỏ thành bốn mảnh dọc theo chiều dài của nó! (Và, phần quan trọng là, bạn có thể thích một trong hai thứ này!)

Thông điệp mang về nhà này là: luôn suy nghĩ cẩn thận về những gì bạn muốn đạt được và loại dữ liệu mà thuật toán của bạn thích - nó quan trọng!


Nhân tiện, PCA sẽ là một trong những thuật toán không muốn được vận hành mà không được chuẩn hóa - chỉ để làm nổi bật khía cạnh khác của câu chuyện.
André
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.