Tôi hiện đang nghiên cứu "Các quy trình Gaussian cho học máy" và trong chương 3, họ nói rằng hậu thế(eq. 3.10) và biến sau tiềm ẩn (eq. 3.9) nói chung không thể giải quyết bằng phương pháp phân tích, do khả năng sigmoid trong (3.9 ) và hàm sigmoid trong (3.10). Để cứu mọi người khỏi phải tìm các phương trình, chúng như sau:
Câu hỏi chính của tôi là: để phân loại nhị phân với được mô hình hóa như một Quá trình Gaussian, tại sao lại sử dụng các hàm sigmoid (trong cả hai phương trình) thay vì hàm Gaussian Điều này sẽ dẫn đến các giải pháp dạng đóng cho cả hai tích phân. Hàm Gaussian không đơn điệu, giống như các hàm sigmoid, nhưng GP có thể tạo ra các hàm với nhiều bước ngoặt, do đó tính đơn điệu có vẻ không cần thiết. Để đảm bảo rằng (3.10) hội tụ để khi là xa dữ liệu huấn luyện, nó có lẽ sẽ đủ để cung cấp cho các trước trung bình :
Trái ngược với hành vi của khả năng sigmoid, khả năng Gaussian sẽ ưu tiên các mục lớn (dương hoặc âm) trong cho các điểm đầu vào được gắn nhãn âm và các mục nhỏ trong cho các điểm được gắn nhãn tích cực.
Các hàm Gaussian sẽ dẫn đến các vấn đề không xảy ra với sigmoids? Có bất kỳ giấy tờ nào trong đó các hàm Gaussian đã được sử dụng trong phân loại GP nhị phân thay vì sigmoids không?
Cập nhật, ngày 25 tháng 5 năm 2017
Khi phản ánh thêm, giá trị trung bình trước không được đề xuất ở trên cũng giúp giải quyết sự mơ hồ về dấu hiệu của nên là gì ( không ủng hộ một trong hai dấu hiệu; ). Giải quyết sự mơ hồ này dường như rất quan trọng, bởi vì nếu giá trị trung bình của trước, , bằng 0, thì giá trị trung bình của cũng sẽ bằng 0 theo khả năng được xác định bởi , vì trước đó và khả năng cả hai sẽ là các hàm chẵn của . I E:
Nếu giá trị trung bình của bằng 0, nhãn tập huấn luyện sẽ không cung cấp bất kỳ thông tin nào về nhãn điểm truy vấn , vì vậy rõ ràng chúng ta không được cho phép việc này. Vì vậy, ngoài việc định nghĩa , có lẽ chúng ta nên tiếp tục thiên vị hướng tới tích cực bằng cách đưa ra độ lệch chuẩn tương đối nhỏ , ví dụ , trong đó là hàm hiệp phương sai và . Nếu chúng ta làm điều này, có lẽ chúng ta cũng nên tăng quy môĐối số của nó, do đó sẽ không phải cách xa trung bình trước đó để tạo ra các giá trị nhỏ của : trong đó .
Đây sẽ là một cách hợp lý để khắc phục vấn đề mơ hồ dấu hiệu ?