Vì vậy, giả sử tôi có một loạt các điểm dữ liệu trong R ^ n, trong đó n khá lớn (như, 50). Tôi biết dữ liệu này rơi vào 3 cụm và tôi biết cụm nào mỗi điểm dữ liệu là một phần của. Tất cả những gì tôi muốn làm là trực quan hóa các cụm này trong 2D theo cách để tối đa hóa sự tách biệt giữa các cụm mà tôi thấy, với mục tiêu là chứng minh rằng các cụm có thể dễ dàng phân tách dựa trên vị trí của điểm dữ liệu trong R ^ n một mình.
Cách mà tôi đã thực hiện cho đến bây giờ liên quan đến việc thực hiện chuyển đổi PCA trên các điểm dữ liệu và sau đó trực quan hóa các cặp PC một cách ngẫu nhiên cho đến khi tôi tìm thấy một cụm nơi có vẻ tách biệt khá rõ ràng. Cách tiếp cận này có vẻ khá đặc biệt, và có vẻ như nên có một cách dễ dàng để tìm một vòng xoay dữ liệu theo kiểu PCA, thay vì tối đa hóa phương sai tổng thể, tối đa hóa sự phân tách giữa các cụm.
Có một kỹ thuật tiêu chuẩn ngoài đó làm điều này? Nếu không, bất kỳ ý tưởng về làm thế nào để tạo ra một sự chuyển đổi như vậy?