Kiểm tra phần 2.3.2 của bài viết này của Chapelle và Zien. Họ có một đẹp heuristic để chọn phạm vi tìm kiếm tốt cho của kernel RBF và C cho SVM. Tôi trích dẫnσC
Để xác định giá trị tốt của các tham số miễn phí còn lại (ví dụ: bằng CV), điều quan trọng là tìm kiếm theo đúng tỷ lệ. Do đó chúng tôi sửa chữa các giá trị mặc định cho và σ có thứ tự đúng của cường độ. Trong một c đẳng cấp vấn đề chúng ta sử dụng 1 / c quantile của khoảng cách cặp D ρ i j của tất cả các dữ liệu điểm như một mặc định cho σ . Mặc định cho C là nghịch đảo của phương sai thực nghiệm s 2 trong không gian tính năng, có thể được tính bằng s 2 = 1Cσc1/cDρijσCs2
từ mộtn×nhạt nhân ma trậnK.s2=1n∑iKii−1n2∑i,jKijn×nK
Sau đó, họ sử dụng bội số (ví dụ cho k ∈ { - 2 , . . . , 2 } ) giá trị mặc định là phạm vi tìm kiếm trong một lưới tìm kiếm bằng cross-validation. Điều đó luôn làm việc rất tốt cho tôi.2kk∈{−2,...,2}
Tất nhiên, chúng tôi @ciri nói, bình thường hóa dữ liệu, vv luôn là một ý tưởng tốt.