Phân tích thành phần chính Vs Lựa chọn tính năng


11

Tôi đang làm một dự án học máy bằng WEKA. Đó là một phân loại có giám sát và trong các thí nghiệm cơ bản của tôi, tôi đã đạt được mức độ chính xác rất kém. Sau đó, ý định của tôi là thực hiện lựa chọn tính năng, nhưng sau đó tôi đã nghe về PCA.

Trong lựa chọn tính năng, những gì chúng tôi làm là chúng tôi xem xét một tập hợp các thuộc tính có tác động lớn nhất đến phân loại được nhắm mục tiêu của chúng tôi (Nếu tôi đúng.)

Trong PCA, theo như tôi biết, những gì chúng tôi làm là chúng tôi tạo ra một lượng nhỏ các thuộc tính nhân tạo sẽ chiếm mục tiêu của chúng tôi. (Vui lòng sửa lại cho tôi nếu tôi sai)

Nhưng tôi không thể hiểu sự khác biệt chính xác giữa hai cái này là gì. Cái nào tốt hơn? Có phụ thuộc vào nghiên cứu cụ thể mà ai đó đang làm không?

Và còn nữa, sự kết hợp của hai phương pháp trên? (Một PCA sau khi lựa chọn tính năng). Liệu no co y nghia gi?


1
Có thể trùng lặp 27300 ?
viết

Câu trả lời:


10

Lựa chọn tính năng

chúng tôi xem xét một tập hợp các thuộc tính có tác động lớn nhất đến phân loại mục tiêu của chúng tôi.

Sự hiểu biết này là hoàn toàn chính xác.

PCA

chúng tôi tạo ra một lượng nhỏ hơn các thuộc tính nhân tạo sẽ chiếm mục tiêu của chúng tôi.

Điều này đúng một phần. Chúng tôi không phải là mục tiêu kế toán trong PCA. Theo thuật ngữ của giáo dân, chúng tôi thực hiện một số giả định về dữ liệu và phân phối của dữ liệu đó và biểu thị dữ liệu có kích thước cao hơn ở kích thước nhỏ hơn nhiều (giả sử 3) có hầu hết nội dung thông tin là dữ liệu gốc. Do đó, PCA là một biến đổi các thuộc tính của bạn thành tập hợp nhân tạo với hầu hết thông tin.

So sánh

Cái nào tốt hơn? Có phụ thuộc vào nghiên cứu cụ thể mà ai đó đang làm không?

Vâng, nó phụ thuộc vào nghiên cứu cụ thể. NẾU giả định được thực hiện trong chuyển đổi PCA giữ, sau đó bằng cách thực hiện PCA, bạn sẽ có cùng thông tin với số lượng nhỏ các thuộc tính. NẾU giả định thất bại phần lớn, thì làm PCA có thể làm hỏng phân loại của bạn.

Sự phối hợp

Liệu no co y nghia gi?

Nó hoàn toàn có ý nghĩa.

Bằng cách chọn tính năng, bạn giảm số lượng kích thước bằng cách loại bỏ thông tin không liên quan. Bằng PCA, bạn giảm số lượng kích thước bằng cách chuyển đổi thành bộ nhân tạo nhưng vẫn giữ nguyên thông tin.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.