Tại sao Bayes Classifier là phân loại lý tưởng?


11

Nó được coi là trường hợp lý tưởng trong đó cấu trúc xác suất nằm dưới các danh mục được biết một cách hoàn hảo.

Tại sao với trình phân loại Bayes, chúng tôi đạt được hiệu suất tốt nhất có thể đạt được?

Bằng chứng / giải thích chính thức cho điều này là gì? Vì chúng tôi luôn sử dụng trình phân loại Bayes làm điểm chuẩn để so sánh hiệu suất của tất cả các trình phân loại khác.

Câu trả lời:


9

Tại sao với trình phân loại Bayes, chúng tôi đạt được hiệu suất tốt nhất có thể đạt được? Bằng chứng / giải thích chính thức cho điều này là gì?

Thông thường, tập dữ liệu D được coi là bao gồm n iid mẫu xi của phân phối tạo dữ liệu của bạn. Sau đó, bạn xây dựng một mô hình tiên đoán từ các dữ liệu đưa ra: cho một mẫu xi , bạn dự đoán lớp f ( x i ) , trong khi các lớp học thực tế của mẫu là f ( x i ) .f^(xi)f(xi)

Tuy nhiên, về mặt lý thuyết, bạn có thể quyết định không chọn một mô hình cụ thể e chọn , nhưng thay vì xem xét tất cả các mô hình có thể f cùng một lúc và kết hợp chúng bằng cách nào đó vào một lớn mô hình F .f^chosenf^F^

Tất nhiên, được cung cấp dữ liệu, nhiều mô- đun nhỏ hơn có thể không khả thi hoặc không phù hợp (ví dụ: các mô hình chỉ dự đoán một giá trị của mục tiêu, mặc dù có nhiều giá trị của mục tiêu trong tập dữ liệu D của bạn ).

Trong mọi trường hợp, bạn muốn dự đoán giá trị đích của các mẫu mới, được rút ra từ cùng phân phối với xi s. Một biện pháp tốt e của việc thực hiện các mô hình của bạn sẽ

e(model)=P[f(X)=model(X)],
ví dụ, xác suất mà bạn dự đoán giá trị mục tiêu đúng đối với một mẫu ngẫu nhiên X .

Sử dụng công thức Bayes, bạn có thể tính toán, xác suất mà mẫu x có giá trị đích v , dựa trên dữ liệu D :

P(vD)=f^P(vf^)P(f^D).

  • P(vf^)01f^x
  • P(f^D)
  • f^

P(vD)

x

v^=argmaxvf^P(vf^)P(f^D).
ve(f^)

Vì chúng tôi luôn sử dụng trình phân loại Bayes làm điểm chuẩn để so sánh hiệu suất của tất cả các trình phân loại khác.

P(vD)


P(v|f)

@RuiQi Tôi không nghĩ rằng có một thứ như trình phân loại Bayes. Tôi biết về trình phân loại Bayes ngây thơ và phân loại Bayes tối ưu.
Antoine

P(vf^)vf^

0

CTCP

XXx

P(CT=CP)=all possible Xf(x)P(CT=CP|x)dx

f(x)X

x

xP(CT=CP|x)x

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.