Tôi đang làm một dự án học máy bằng WEKA. Đó là một phân loại có giám sát và trong các thí nghiệm cơ bản của tôi, tôi đã đạt được mức độ chính xác rất kém. Sau đó, ý định của tôi là thực hiện lựa chọn tính năng, nhưng sau đó tôi đã nghe về PCA.
Trong lựa chọn tính năng, những gì chúng tôi làm là chúng tôi xem xét một tập hợp các thuộc tính có tác động lớn nhất đến phân loại được nhắm mục tiêu của chúng tôi (Nếu tôi đúng.)
Trong PCA, theo như tôi biết, những gì chúng tôi làm là chúng tôi tạo ra một lượng nhỏ các thuộc tính nhân tạo sẽ chiếm mục tiêu của chúng tôi. (Vui lòng sửa lại cho tôi nếu tôi sai)
Nhưng tôi không thể hiểu sự khác biệt chính xác giữa hai cái này là gì. Cái nào tốt hơn? Có phụ thuộc vào nghiên cứu cụ thể mà ai đó đang làm không?
Và còn nữa, sự kết hợp của hai phương pháp trên? (Một PCA sau khi lựa chọn tính năng). Liệu no co y nghia gi?