Tại sao tên là kernel kernel trong thống kê và ML?


21

Điều này đã được hỏi trên các trang SE khác trong bối cảnh hệ điều hành và đại số tuyến tính, nhưng câu hỏi tương tự làm tôi bối rối về các phương pháp kernel được sử dụng trong thống kê và học máy.

Thông thường người ta nói rằng các hạt nhân, ví dụ như trong ước tính mật độ hạt nhân hoặc SVM, đại diện cho một số loại tương tự, nhưng tôi không biết tên 'kernel' xuất phát từ đâu và tính biểu tượng của nó là gì.

Vậy, từ nguyên của hạt nhân là gì, trong bối cảnh thống kê và học máy?

Để rõ ràng, tôi nhận thức rõ hạt nhân là gì và các thuộc tính chính của nó, tôi chỉ tò mò về cái tên, vì tôi không thấy nó phải làm gì với hạt giống hay lõi như được định nghĩa chủ yếu trong từ điển. Hoặc ít nhất tôi không thể thấy một ý nghĩa sâu sắc hơn "phần thiết yếu của phương pháp".

Câu trả lời:


13

Bạn có thể tìm thấy một số thông tin về vấn đề này bằng cách kiểm tra trang web để biết cách sử dụng sớm nhất đối với một số từ của toán học được duy trì bởi nhà toán học Jeff Miller. Bạn cũng có thể tìm thấy thông tin về từ nguyên của từ "kernel" trong các nguồn từ điển chuẩn.

Viết bằng tiếng Pháp, Fredholm (1903) đã sử dụng từ "noyau" (cốt lõi) và Hilbert (1904) thông qua thuật ngữ này nhưng viết bằng tiếng Đức, mang lại từ tiếng Đức "kern" (lõi). Những thuật ngữ này đã được sử dụng trong bối cảnh viết về các phương trình tích phân trong phân tích chức năng. Ngay sau đó, Bôcher (1909), viết bằng tiếng Anh, sử dụng thuật ngữ "kernel" để chỉ các đối tượng tương tự. Thuật ngữ này sau đó lan truyền thông qua các tài liệu tiếng Anh về phân tích chức năng, phân tích Fourier, và sau đó, xác suất và thống kê.

Theo từ điển liên kết ở trên, từ này bắt nguồn từ tiếng Anh cổ và tiếng Proto-Germanic. Nó có thể đề cập đến một hạt giống, hoặc đến lõi, trung tâm hoặc bản chất của một đối tượng. Sự giống nhau về ngôn ngữ giữa "hạt nhân" và "hạt nhân" của Đức dường như là do các dẫn xuất lịch sử tương tự. Từ "hạt nhân" được cho là bắt nguồn từ một giả thuyết (tái cấu trúc) từ Proto-Germanic "kurną" (ngô). Vì vậy, dựa trên lịch sử này, có vẻ như về mặt từ nguyên, từ "hạt nhân" dùng để chỉ một hạt giống, cốt lõi hoặc bản chất, và dựa trên sự viết tắt của một từ tiếng Đức cũ cho ngô.

CẬP NHẬT: Câu trả lời này đã được chỉnh sửa rất nhiều để phản ánh thông tin mới được người dùng cbeleitesRM chú ý đến tôi . Ban đầu tôi nghĩ rằng đây có thể là một từ Anh ngữ gần đây của từ "kern", nhưng các nguồn từ điển cho thấy từ "kernel" trong tiếng Anh rất cũ. Tôi không phải là nhà ngôn ngữ học, vì vậy tôi chỉ đơn thuần đưa ra thông tin từ các nguồn trên.


Chưa bao giờ nghe nói về Maxime Bôcher. Lần đầu tiên, tôi nghĩ có lẽ đó là một lỗi đánh máy cho Salomon Bochner, người mà vài năm sau đó rất lớn (một người khổng lồ) trong các hạt nhân tích hợp, trong số những thứ khác.
Mark L. Stone

Đó là lỗi của tôi - Tôi không chắc cách nhập o có dấu. Bạn đã làm nó như thế nào?
Phục hồi Monica

1
Tôi đã sao chép và dán từ danh sách Wikipedia.
Mark L. Stone

1
Quan điểm thực sự của tôi là tôi biết Bochner là một người khổng lồ trong hạt nhân, nhưng chưa bao giờ nghe nói về Bocher .. Bochner là cố vấn luận án của Samuel Karlin, từ đó tôi đã tham gia một khóa học về Tích cực (nhân hoàn toàn tích cực tạo ra các biến đổi làm giảm đi, và tất cả điều đó nhạc jazz).
Mark L. Stone

1
Tôi không chắc liệu kernel có phải là phiên bản thu gọn của Kern hay không, ít nhất là không phải theo nghĩa của một điều gì đó đã xảy ra chỉ hơn 100 năm trước. Tôi luôn lấy nó làm bản dịch: merriam-webster.com/dipedia/kernel định nghĩa 1 được gọi là "Kern" trong tiếng Đức. Ví dụ, đối với một quả táo, hạt = Kerne, trong khi lõi = Kerngehäuse (nghĩa đen là vỏ hạt nhân).
cbeleites hỗ trợ Monica

13

Một hạt nhân được sử dụng nhiều lần trong Machine Learning và thống kê. Một vài ví dụ là:

  1. Trong Support Vector Machines một hạt nhân là một hàm ánh xạ dữ liệu đến một không gian cao hơn chiều nơi mà vấn đề trở nên tuyến tính có thể giải quyết (xem này ).

  2. Ước tính mật độ hạt nhân

    Ước tính mật độ hạt nhân là một cách không tham số để ước tính hàm mật độ xác suất của một biến ngẫu nhiên.

Trong ngữ cảnh này, kernel chỉ đơn giản là một hàm trọng số được sử dụng trong ước tính mật độ kernel. Liên kết cuối cùng cũng có thêm một vài cách sử dụng kernel từ trong thống kê.

  1. Trong Mạng nơ-ron kết hợp , hạt nhân là một ma trận nhỏ được sử dụng để thực hiện phép chập giữa hình ảnh và chính nó. Xem tại đây .

Trong tất cả các ví dụ này, kernel là một hàm toán học được sử dụng cho một số loại chuyển đổi trên dữ liệu của bạn. Hạt nhân về cơ bản là phần không đổi của sự biến đổi đó. Tùy thuộc vào sự lựa chọn kernel mà chúng ta sử dụng cho mỗi phép chuyển đổi, chúng ta có thể nhận được hiệu ứng khác nhau từ nó.


5
βe-βxe-βx

7
OP đang tìm kiếm từ nguyên của hạt nhân.
Franck Dernoncourt

2
Việc sử dụng "kernal" để chỉ nullspace trong đại số tuyến tính có liên quan gì đến bất kỳ cách sử dụng nào trong học máy không?
cú pháp
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.