Dữ liệu có nên được căn giữa + thu nhỏ trước khi áp dụng t-SNE?


18

Một số tính năng của dữ liệu của tôi có giá trị lớn, trong khi các tính năng khác có giá trị nhỏ hơn nhiều.

Có cần phải căn giữa dữ liệu + tỷ lệ trước khi áp dụng t-SNE để ngăn chặn sự thiên vị đối với các giá trị lớn hơn không?

Tôi sử dụng triển khai sklearn.manifold.TSNE của Python với số liệu khoảng cách euclide mặc định.

Câu trả lời:


18

Việc định tâm không quan trọng vì thuật toán chỉ hoạt động trên khoảng cách giữa các điểm, tuy nhiên việc thay đổi kích thước là cần thiết nếu bạn muốn các kích thước khác nhau được coi trọng như nhau, vì định mức 2 sẽ bị ảnh hưởng nhiều hơn bởi các kích thước có phương sai lớn.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.