Tại sao các mô hình phân tích phân biệt đối xử Gaussian hung được gọi như vậy?


13

Các mô hình phân tích phân biệt Gaussian học và sau đó áp dụng quy tắc Bayes để đánh giá P ( y | x ) = P ( x | y ) P p r i o r ( y )P(x|y)Do đó, chúng là mô hình thế hệ. Tại sao sau đó nó được gọi là phân tích phân biệt? Nếu đó là bởi vì cuối cùng chúng ta đã rút ra một đường cong phân biệt giữa các lớp, thì điều đó xảy ra cho tất cả các mô hình thế hệ.

P(y|x)= =P(x|y)PprTôior(y)ΣgYP(x|g)PprTôior(g).

Câu trả lời:


19

Nếu bạn muốn nói đến LDA, tôi sẽ nói tên, phân tích phân biệt đối xử tuyến tính, có thể được giải thích trong lịch sử ít nhất là từ bài báo của Fisher từ năm 1936 , theo hiểu biết tốt nhất của tôi, trước thuật ngữ và sự phân biệt hiện tại trong học máy giữa phân biệt đối xử và một mô hình thế hệ. Không phải là Fisher gọi nó là phân tích phân biệt tuyến tính trực tiếp, nhưng anh ta rõ ràng yêu cầu một hàm tuyến tính để phân biệt đối xử. Như một nhận xét về mặt tò mò, Fisher đã xem xét sự phân biệt đối xử đối với dữ liệu Iris nổi tiếng trong bài báo.

Nhân tiện, Fisher đã không trình bày phương pháp tuyến tính để phân biệt đối xử theo mô hình thế hệ. Ông đã tìm kiếm một sự kết hợp tuyến tính (đối với hai lớp) nhằm tối đa hóa tỷ lệ của sự bất hòa giữa nhóm đến đúng trong nhóm , mà không đòi hỏi một giả định bình thường. Chi tiết và cách nó liên quan đến LDA như một quy tắc Bayes cho một mô hình thế hệ, có thể được tìm thấy trong Chương 3 trong cuốn sách "Nhận dạng mẫu và Mạng lưới thần kinh" của Brian Ripley.


2

(Y= =0,Y= =1)

  1. P(X|Y= =0)~N(μ0,Σ0)
  2. P(X|Y= =1)~N(μ1,Σ1)
  3. P(Y= =1)= =1-P(Y= =0)= =Φ

(μ0,Σ0,μ1,Σ1,Φ) sử dụng ước tính khả năng tối đa.

Vì vậy, đó là Gaussian vì nó sử dụng giả định gaussian cho phân phối nội bộ (bạn có thể muốn sử dụng đồng phục thay cho ex) và phân biệt đối xử vì nó nhằm mục đích tách dữ liệu thành các nhóm.

Bạn có thể tìm thêm thông tin ở đây .

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.