Tôi đang học 'Giới thiệu về học thống kê' của James, Witten, Hastie, Tibshirani.
Trong trang 139, trong cuốn sách của họ, họ đã bắt đầu bằng cách giới thiệu Định lý của Bayes . πkhông phải là hằng số toán học, nhưng biểu thị xác suất trước. Không có gì là lạ trong phương trình này.
Cuốn sách tuyên bố rằng nó muốn có được ước tính cho rằng nó có thể cắm vào phương trình đã cho ở trên. Để ước tính f k ( x ) , nó giả sử đó là bình thường. Trong cài đặt một chiều, f k ( x ) = 1, nơiμkvàσ 2 k là giá trị trung bình và phương sai choklớp thứ. Người ta cho rằngσ 2 1 =σ 2 2 =⋯=σ 2 K . (Tôi bắt đầu bối rối từ tuyên bố cuối cùng.)
Cắm vào p x , bạn có phương trình khá lộn xộn này (1):
Một lần nữa, không có gì ngạc nhiên ở đây vì nó chỉ là sự thay thế.
Trình phân loại của Bayes liên quan đến việc gán một quan sát cho lớp mà phương trình (1) là lớn nhất. Lấy nhật ký của phương trình (1) và sắp xếp lại các thuật ngữ, không khó để chỉ ra rằng điều này tương đương với việc gán quan sát cho lớp mà sau đây là lớn nhất:
Câu hỏi: Tôi không hiểu điều này đến từ đâu và ý nghĩa của nó. Tôi đã thử làm nhật ký phương trình và nó không trở thành thế này. Có phải chúng ta đang lấy đạo hàm ở đâu đó ở đây, vì đây là quan sát lớn nhất?