Áp dụng mánh khóe của kernel vào các phương pháp tuyến tính?


20

Thủ thuật kernel được sử dụng trong một số mô hình học máy (ví dụ: SVM ). Nó được giới thiệu lần đầu tiên trong bài viết "Cơ sở lý thuyết của phương pháp chức năng tiềm năng trong nghiên cứu nhận dạng mẫu" vào năm 1964.

Định nghĩa wikipedia nói rằng nó là

một phương pháp sử dụng thuật toán phân loại tuyến tính để giải quyết vấn đề phi tuyến tính bằng cách ánh xạ các quan sát phi tuyến tính ban đầu vào một không gian có chiều cao hơn, trong đó phân loại tuyến tính sau đó được sử dụng; điều này làm cho một phân loại tuyến tính trong không gian mới tương đương với phân loại phi tuyến tính trong không gian ban đầu.

Một ví dụ về mô hình tuyến tính đã được mở rộng cho các vấn đề phi tuyến tính là PCA kernel . Thủ thuật kernel có thể được áp dụng cho bất kỳ mô hình tuyến tính nào không, hoặc nó có những hạn chế nhất định không?


1
BTW, hạt nhân không thực sự cần thiết cho SVM. "Trái tim" của SVM là nguyên tắc tối đa hóa biên mềm. Chuyển đến biểu diễn kernel làm cho chiều của vấn đề của bạn O (m ^ 2) thay vì O (d) trong đó m là số ví dụ và d là thứ nguyên của không gian tính năng của bạn, vì vậy nếu m ^ 2 nhiều hơn d, bạn có thể tốt hơn hết là tránh xa các hạt nhân jmlr.csail.mit.edu/ con / v6 / kerthi05a.html
Yaroslav Bulatov

@ Nam Tư: Cảm ơn bạn đã tham khảo. Bạn có biết về bất kỳ triển khai nào của "Phương pháp Newton hữu hạn đã sửa đổi" đó không?
Shane

không, nhưng các trang của Keerthi và Langford có liên kết đến một số phần mềm có thể liên quan, vì cả hai đều làm việc tại Yahoo Research
Yaroslav Bulatov

Câu trả lời:


17

Thủ thuật kernel chỉ có thể được áp dụng cho các mô hình tuyến tính trong đó các ví dụ trong công thức vấn đề xuất hiện dưới dạng các sản phẩm dấu chấm (Support Vector Machines, PCA, v.v.).


Cảm ơn câu trả lời. @mbq @ mun1: IMO chúng tôi cần nỗ lực nhiều hơn để đăng các câu hỏi học máy nghiêm túc hơn trên trang web, để thu hút thêm cộng đồng đó.
Shane

@Shane Tôi hoàn toàn đồng ý, nhưng còn trang web SO khác như metaoptizes.com/qa thì sao?
chl

@chl: Đó cũng là một tùy chọn, nhưng nó không phải là một phần của StackExchange (nó được kiểm soát bởi một người và trên các phần mềm khác nhau) và cá nhân tôi muốn có các cộng đồng phân tích dữ liệu khác nhau ở một nơi.
Shane

@Shane Vâng, nó có ý nghĩa.
chl

có cũng Machine Learning chồng đề nghị trao đổi area51.stackexchange.com/proposals/7607/machine-learning
Yaroslav Bulatov


2

@ mun1 đưa ra quan điểm chính (+1), tôi là đồng tác giả của một bài báo thảo luận về cách nhân các mô hình tuyến tính tổng quát, ví dụ hồi quy logistic và hồi quy Poisson, nó khá đơn giản.

GC Cawley, GJ Janacek và NLC Talbot, các máy nhân tổng quát, trong Kỷ yếu của Hội nghị chung quốc tế của IEEE / INNS về Mạng thần kinh (IJCNN-2007), trang 1732-1737, Orlando, Florida, Hoa Kỳ, ngày 12 đến 17 tháng 8 năm 2007. ( www , pdf )

Tôi cũng đã viết một hộp công cụ MATLAB (chất lượng nghiên cứu) (đáng buồn là không có hướng dẫn), mà bạn có thể tìm thấy ở đây .

Có thể mô hình hóa phân phối mục tiêu là khá hữu ích trong việc xác định độ không chắc chắn, v.v. vì vậy nó là một bổ sung hữu ích (nếu khá gia tăng) cho các phương pháp học kernel.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.