Trong khi học cách tính ma trận hiệp phương sai và ma trận tương quan và nghịch đảo của chúng trong VB và T-SQL vài năm trước, tôi đã học được rằng các mục khác nhau có các thuộc tính thú vị có thể giúp chúng hữu ích trong các tình huống khai thác dữ liệu phù hợp. Một ví dụ rõ ràng là sự hiện diện của phương sai trên các đường chéo của ma trận hiệp phương sai; Một số ví dụ ít rõ ràng hơn mà tôi chưa sử dụng, nhưng đôi khi có thể có ích, là các yếu tố lạm phát phương sai trong ma trận tương quan nghịch đảo và tương quan một phần trong ma trận hiệp phương sai.
Tuy nhiên, một điều tôi chưa thấy được đề cập trực tiếp trong tài liệu là làm thế nào để giải thích các yếu tố quyết định của các ma trận này. Do các yếu tố quyết định thường được tính cho các loại ma trận khác, tôi dự kiến sẽ tìm thấy rất nhiều thông tin về chúng, nhưng tôi đã tìm thấy rất ít trong các tìm kiếm thông thường của cả diễn đàn StackExchange và phần còn lại của Internet. Hầu hết các đề cập tôi đã gặp đều xoay quanh việc sử dụng các yếu tố quyết định như một bước duy nhất trong quá trình tính toán các kiểm tra và thuật toán thống kê khác, chẳng hạn như Phân tích thành phần nguyên tắc (PCA) và một trong các thử nghiệm của Hotelling; không ai trực tiếp giải quyết làm thế nào để tự mình giải thích các yếu tố quyết định này. Có một lý do thực tế tại sao chúng không được thảo luận thường xuyên trong tài liệu về khai thác dữ liệu? Quan trọng hơn, họ có cung cấp bất kỳ thông tin hữu ích nào theo cách độc lập không và nếu có, làm thế nào tôi có thể diễn giải các yếu tố quyết định của từng loại? Tôi nhận ra rằng các yếu tố quyết định là một loại khối lượng đã ký được tạo ra bởi một phép biến đổi tuyến tính, vì vậy tôi nghi ngờ rằng các yếu tố quyết định của các yếu tố xác định cụ thể này có thể biểu thị một số loại phép đo hiệp phương sai hoặc tương quan, v.v. trên toàn bộ tập hợp, hoặc một cái gì đó cho hiệu ứng đó ( trái ngược với hiệp phương sai và tương quan thông thường, nằm giữa hai thuộc tính hoặc biến). Điều đó cũng đặt ra câu hỏi về loại khối lượng mà nghịch đảo của chúng sẽ đại diện. Tôi không đủ quen thuộc với chủ đề hoặc toán học ma trận nặng có liên quan để suy đoán thêm, nhưng tôi có khả năng mã hóa cả bốn loại ma trận và các yếu tố quyết định của chúng. Câu hỏi của tôi không bức xúc, nhưng về lâu dài tôi sẽ phải đưa ra quyết định về việc có thường xuyên đưa các ma trận này và các yếu tố quyết định của chúng vào các quy trình khai thác dữ liệu khám phá của tôi hay không. Nó rẻ hơn khi chỉ tính toán hiệp phương sai và tương quan theo cách một đối một, chia đôi trong các ngôn ngữ cụ thể này, nhưng tôi sẽ đi xa hơn và thực hiện các phép tính xác định nếu tôi có thể rút ra một số hiểu biết sâu sắc hơn để chứng minh chi phí về tài nguyên lập trình. Cảm ơn trước. sẽ đi xa hơn và thực hiện các tính toán xác định nếu tôi có thể rút ra một số hiểu biết sâu sắc hơn để chứng minh chi phí về tài nguyên lập trình. Cảm ơn trước. sẽ đi xa hơn và thực hiện các tính toán xác định nếu tôi có thể rút ra một số hiểu biết sâu sắc hơn để chứng minh chi phí về tài nguyên lập trình. Cảm ơn trước.