Tôi biết rằng mục tiêu của PCA là giảm tính chiều
Đây thường là những gì mọi người giả định, nhưng trên thực tế, PCA chỉ là sự thể hiện dữ liệu của bạn trên cơ sở trực giao. Cơ sở này vẫn có cùng chiều với dữ liệu gốc của bạn. Không có gì bị mất ... chưa. Phần giảm kích thước hoàn toàn phụ thuộc vào bạn. Điều PCA đảm bảo là các kích thước trên cùng của phép chiếu mới của bạn là các kích thước tốt nhất mà dữ liệu của bạn có thể được biểu diễn dưới dạng. Điều đó có nghĩa gì nhất? Đó là nơi mà phương sai được giải thích xuất hiện.kk k
rõ ràng là không phải trong trường hợp này
Tôi sẽ không chắc về điều đó! Từ âm mưu thứ hai của bạn, có vẻ như rất nhiều thông tin từ dữ liệu của bạn có thể được chiếu lên một đường nằm ngang. Đó là 1 chiều, thay vì cốt truyện gốc ở 2 chiều! Rõ ràng là bạn mất một số thông tin vì bạn đang loại bỏ trục Y, nhưng liệu việc mất thông tin này có được bạn chấp nhận hay không, đó là cuộc gọi của bạn.
Có rất nhiều câu hỏi liên quan đến PCA là gì trên trang web vì vậy tôi khuyến khích bạn kiểm tra chúng ở đây , đây , đây hoặc đây . Nếu bạn có câu hỏi khác sau đó, xin vui lòng gửi chúng và tôi rất sẵn lòng giúp đỡ.
Như câu hỏi thực tế của bạn:
câu chuyện bạn có thể kể về nhiệt độ so với kem trong cốt truyện PCA là gì?
Vì trục tọa độ mới là sự kết hợp tuyến tính của tọa độ ban đầu, nên ... về cơ bản không có gì! PCA sẽ cho bạn câu trả lời như (số tạo thành):
PC1PC2=2.5×ice cream−3.6×temperature=−1.5×ice cream+0.6×temperature
Điều đó có hữu ích với bạn không? Có lẽ. Nhưng tôi đoán là không :)
Đã chỉnh sửa
Tôi sẽ thêm tài nguyên này mà tôi nghĩ là hữu ích vì biểu đồ tương tác rất tuyệt.
Chỉnh sửa lại
Để làm rõ ý nghĩa tốt nhất của :k
PCA cố gắng tìm các kích thước mang lại phương sai cao nhất khi dữ liệu được chiếu lên chúng. Giả sử dữ liệu của bạn có kích thước, PC đầu tiên giải thích nhiều phương sai trong dữ liệu của bạn hơn bất kỳ kích thước nào khác có thể. Đó là những gì tôi có nghĩa là tốt nhất . Cho dù điều đó có hữu ích với bạn hay không là một điều khác.k k kn>kkk k