Khi sử dụng libsvm
, tham số là tham số cho hàm kernel. Giá trị mặc định của nó là thiết lập như γ = 1
Có hướng dẫn lý thuyết nào để thiết lập tham số này bên cạnh các phương thức hiện có, ví dụ: tìm kiếm lưới không?
Khi sử dụng libsvm
, tham số là tham số cho hàm kernel. Giá trị mặc định của nó là thiết lập như γ = 1
Có hướng dẫn lý thuyết nào để thiết lập tham số này bên cạnh các phương thức hiện có, ví dụ: tìm kiếm lưới không?
Câu trả lời:
Tôi sẽ đề nghị hướng dẫn lý thuyết sau đây. Khi bạn đang sử dụng hạt nhân Gaussian RBF, bề mặt phân tách của bạn sẽ dựa trên sự kết hợp của các bề mặt hình chuông ở giữa tại mỗi vectơ hỗ trợ. Chiều rộng của mỗi bề mặt chuông hình sẽ tỉ lệ nghịch với . Nếu chiều rộng này nhỏ hơn khoảng cách cặp tối thiểu cho dữ liệu của bạn, về cơ bản bạn có quá nhiều. Nếu chiều rộng này lớn hơn khoảng cách cặp đôi tối đa cho dữ liệu của bạn, tất cả các điểm của bạn rơi vào một lớp và bạn cũng không có hiệu suất tốt. Vì vậy, chiều rộng tối ưu nên ở đâu đó giữa hai thái cực này.
Không, nó chủ yếu phụ thuộc vào dữ liệu. Tìm kiếm lưới (siêu tham số được chuyển đổi nhật ký) là một phương pháp rất tốt nếu bạn chỉ có một số lượng nhỏ các tham số siêu điều chỉnh, nhưng không làm cho độ phân giải lưới quá tốt hoặc bạn có thể điều chỉnh quá mức điều chỉnh tiêu chuẩn. Đối với các vấn đề với số lượng tham số kernel lớn hơn, tôi thấy phương pháp đơn giản Nelder-Mead hoạt động tốt.
pair-wise distance for your data
= khoảng cách Euclide đơn giản sau khi nhân rộng?