"Phân tích phân biệt đối xử của Fisher" chỉ đơn giản là LDA trong tình huống gồm 2 lớp. Khi chỉ có 2 lớp tính toán bằng tay là khả thi và phân tích có liên quan trực tiếp đến Đa hồi quy. LDA là phần mở rộng trực tiếp của ý tưởng của Fisher về tình hình của bất kỳ số lớp nào và sử dụng các thiết bị đại số ma trận (như eigendecro) để tính toán nó. Vì vậy, thuật ngữ "Phân tích phân biệt đối xử của Fisher" có thể được coi là lỗi thời ngày nay. "Phân tích phân biệt tuyến tính" nên được sử dụng thay thế. Xem thêm . Phân tích phân biệt đối xử với 2+ lớp (đa lớp) là hợp quy bởi thuật toán của nó (trích xuất các chất dicriminants như các biến thể chính tắc); thuật ngữ hiếm "Phân tích phân biệt đối xử Canonical"
Fisher đã sử dụng cái được gọi là "Hàm phân loại Fisher" để phân loại các đối tượng sau khi hàm phân biệt đã được tính toán. Ngày nay, cách tiếp cận chung hơn của Bayes được sử dụng trong quy trình LDA để phân loại các đối tượng.
Theo yêu cầu của bạn để giải thích về LDA, tôi có thể gửi cho bạn các câu trả lời của tôi: trích xuất trong LDA , phân loại trong LDA , LDA trong số các thủ tục liên quan . Ngoài này , này , này các câu hỏi và câu trả lời.
Giống như ANOVA yêu cầu một giả định về phương sai bằng nhau, LDA yêu cầu một giả định về ma trận phương sai hiệp phương sai bằng nhau (giữa các biến đầu vào) của các lớp. Giả định này rất quan trọng đối với giai đoạn phân loại. Nếu các ma trận khác nhau đáng kể, các quan sát sẽ có xu hướng được gán cho lớp nơi độ biến thiên lớn hơn. Để khắc phục vấn đề, QDA đã được phát minh. QDA là một sửa đổi của LDA, cho phép tính không đồng nhất ở trên của ma trận hiệp phương sai của các lớp.
Nếu bạn có tính không đồng nhất (ví dụ như được phát hiện bởi thử nghiệm M của Box) và bạn không có QDA trong tay, bạn vẫn có thể sử dụng LDA trong chế độ sử dụng ma trận hiệp phương sai riêng lẻ (thay vì ma trận gộp) của phân biệt đối xử trong phân loại . Điều này phần nào giải quyết vấn đề, mặc dù kém hiệu quả hơn trong QDA, bởi vì - như chỉ ra - đây là các ma trận giữa các phân biệt và không phải giữa các biến ban đầu (ma trận khác nhau).
Hãy để tôi phân tích dữ liệu ví dụ của bạn cho chính mình.
Trả lời câu trả lời và bình luận của @ zyxue
LDA là những gì bạn xác định FDA là trong câu trả lời của bạn. Đầu tiên LDA trích xuất các cấu trúc tuyến tính (được gọi là phân biệt đối xử) để tối đa hóa khoảng cách giữa đến bên trong và sau đó sử dụng các cấu trúc để thực hiện phân loại (gaussian). Nếu (như bạn nói) LDA không bị ràng buộc với nhiệm vụ trích xuất các phân biệt đối xử LDA dường như chỉ là một trình phân loại gaussian, thì không cần tên "LDA" nào cả.
SwSws là như nhau, hiệp phương sai nói trong lớp đều giống nhau, bản sắc; quyền sử dụng chúng trở nên tuyệt đối.)
Trình phân loại Gaussian (giai đoạn thứ hai của LDA) sử dụng quy tắc Bayes để gán các quan sát cho các lớp bởi các phân biệt đối xử. Kết quả tương tự có thể được thực hiện thông qua cái gọi là các hàm phân loại tuyến tính Fisher sử dụng các tính năng gốc trực tiếp. Tuy nhiên, cách tiếp cận của Bayes dựa trên các phân biệt đối xử hơi chung chung ở chỗ nó sẽ cho phép sử dụng các ma trận hiệp phương sai phân biệt lớp riêng biệt, ngoài cách sử dụng mặc định, một cách gộp. Ngoài ra, nó sẽ cho phép phân loại dựa trên một tập hợp các phân biệt đối xử.
Khi chỉ có hai lớp, cả hai giai đoạn của LDA có thể được mô tả cùng nhau trong một lần duy nhất vì "trích xuất độ trễ" và "phân loại quan sát" giảm sau đó đến cùng một nhiệm vụ.