Khi bạn bối rối, hãy để tôi bắt đầu bằng cách nêu rõ vấn đề và đưa ra từng câu hỏi của bạn. Bạn có cỡ mẫu là 10.000 và mỗi mẫu được mô tả bằng một vectơ đặc trưng . Nếu bạn muốn thực hiện hồi quy sử dụng các hàm cơ sở xuyên tâm Gaussian sau đó đang tìm kiếm một chức năng có dạng f ( x ) = Σ j w j * g j ( x ; μ j , σ j ) , j = 1 .. m nơi g ix∈R31
f(x)=∑jwj∗gj(x;μj,σj),j=1..m
gilà các chức năng cơ bản của bạn. Cụ thể, bạn cần phải tìm ra
trọng lượng
w j để cho các thông số cho
μ j và
σ j bạn giảm thiểu các lỗi giữa
y và dự đoán tương ứng với
y =
f ( x ) - thường bạn sẽ giảm thiểu sai số bình phương nhỏ nhất.
mwjμjσjyy^f(x^)
Chính xác thì tham số j là gì?
Bạn cần tìm cơ sở hàm g j . (Bạn vẫn cần phải xác định số m ) Mỗi chức năng cơ sở sẽ có một μ j và σ j (cũng không rõ). Các chỉ số j dao động từmgjmμjσjj đến m .1m
Là một vectơ?μj
Vâng, đó là một điểm trong . Nói cách khác, nó là điểm ở đâu đó trong không gian đặc trưng của bạn và một μR31μ phải được xác định cho mỗi hàm cơ sở.m
Tôi đã đọc rằng điều này chi phối các vị trí của các chức năng cơ bản. Vì vậy, đây không phải là ý nghĩa của một cái gì đó?
Hàm cơ sở được tập trung tại μ j . Bạn sẽ cần phải quyết định nơi các địa điểm này. Vì vậy, không, nó không nhất thiết là ý nghĩa của bất cứ điều gì (nhưng xem thêm để biết cách xác định)jthμj
Bây giờ cho sigma "chi phối quy mô không gian". Chính xác thì đó là gì?
là dễ hiểu nếu chúng ta chuyển sang các chức năng cơ sở mình.σ
Nó giúp nghĩ về các hàm cơ sở xuyên tâm Gaussian trong các độ sáng thấp hơn, giả sử hoặc R 2 . Trong R 1 , hàm cơ sở xuyên tâm Gaussian chỉ là đường cong hình chuông nổi tiếng. Chuông tất nhiên có thể hẹp hoặc rộng. Chiều rộng được xác định bởi σ - lớn hơn σ là hẹp hơn hình dạng chuông. Nói cách khác, σ quy mô chiều rộng của hình chuông. Vì vậy, đối σ = 1 chúng tôi không có mở rộng quy mô. Cho lớnR1R2R1σσσσ chúng tôi có tỉ lệ đáng kể.σ
Bạn có thể hỏi mục đích của việc này là gì. Nếu bạn nghĩ về chiếc chuông bao phủ một phần không gian (một dòng trong ) - một chiếc chuông hẹp sẽ chỉ bao phủ một phần nhỏ của dòng *. Điểm x gần trung tâm của chuông sẽ có giá trị g j ( x ) lớn hơn . Các điểm ở xa trung tâm sẽ có giá trị g j ( x ) nhỏ hơn . Chia tỷ lệ có tác dụng đẩy các điểm ra xa trung tâm hơn - vì chuông thu hẹp các điểm sẽ nằm xa trung tâm hơn - làm giảm giá trị của g j ( x )R1xgj(x)gj(x)gj(x)
Mỗi hàm cơ sở chuyển đổi vectơ đầu vào x thành giá trị vô hướng
Có, bạn đang đánh giá các hàm cơ bản tại một số điểm x∈R31 .
exp(−∥x−μj∥222∗σ2j)
Bạn nhận được một vô hướng như là kết quả. Kết quả vô hướng phụ thuộc vào khoảng cách của điểm từ trung tâm μx do ‖ x - μ j ‖ và vô hướng σ j .μj∥x−μj∥σj
Tôi đã thấy một số triển khai thử các giá trị như .1, .5, 2.5 cho tham số này. Làm thế nào là những giá trị được tính toán?
Tất nhiên đây là một trong những khía cạnh thú vị và khó khăn khi sử dụng các hàm cơ sở xuyên tâm của Gaussian. Nếu bạn tìm kiếm trên web, bạn sẽ tìm thấy nhiều gợi ý về cách xác định các tham số này. Tôi sẽ phác thảo trong các điều khoản rất đơn giản một khả năng dựa trên phân cụm. Bạn có thể tìm thấy điều này và một số gợi ý khác trực tuyến.
Bắt đầu bằng cách phân cụm 10000 mẫu của bạn (trước tiên bạn có thể sử dụng PCA để giảm kích thước theo sau là phân cụm k-Means). Bạn có thể đặt là số cụm bạn tìm thấy (thường sử dụng xác thực chéo để xác định m tốt nhấtmm ). Bây giờ, tạo một hàm cơ sở xuyên tâm cho mỗi cụm. Đối với mỗi hàm cơ sở xuyên tâm để μ j là trung tâm (ví dụ trung bình, centroid, vv) của cluster. Hãy σ j phản ánh chiều rộng của cụm (ví dụ bán kính ...) Bây giờ đi trước và thực hiện hồi quy của bạn (mô tả này đơn giản chỉ là một overview- nó cần rất nhiều công việc tại mỗi bước!)gjμjσj
* Tất nhiên, đường cong hình chuông được định nghĩa từ - đến ∞ như vậy sẽ có giá trị ở khắp mọi nơi trên đường dây. Tuy nhiên, các giá trị xa trung tâm là không đáng kể∞∞