Tôi hiện đang thử nghiệm với gridsearch để đào tạo một máy vectơ hỗ trợ. Tôi hiểu rằng, nếu tôi có tham số gamma và C, hàm R Tune.svm thực hiện xác thực chéo 10 lần cho tất cả các kết hợp của 2 tham số này.
Vì tôi không biết bắt đầu như thế nào, tôi đã cố gắng lấy một số thông tin về nó, ví dụ wikipedia 2 gợi ý các giá trị không tuyến tính, ví dụ C trong phạm vi {10, 100, 1000}.
Cho đến nay tôi sử dụng các ví dụ từ liên kết wikipedia thứ hai của mình, đó là:
gammas = 2^(-15:3)
costs = 2^(-5:15)
Kết quả thành 399 kết hợp.
Điều này mất rất, rất lâu (~ 2000 mẫu). Ví dụ, đối với kernel "radial", kết quả tốt nhất của tôi là gamma = 0,5 và cost = 2.
Tôi không thể nhận được kết quả tương tự nếu tôi chỉ sử dụng các giá trị như (1, 2, 3, 4, ... 10) cho chi phí và (0, 0,5, 1, 1.5, 2) cho các gamma? Tôi biết ví dụ này được xây dựng vì tôi đã biết kết quả.
Câu hỏi của tôi:
Nhưng tại sao quy mô theo cấp số nhân này?
Có rất nhiều giá trị từ 0 đến 1 mà tôi nghĩ rằng đây là một sự lãng phí thời gian tính toán và chỉ có rất ít con số rất lớn mà dù sao nó cũng không thể tìm thấy một kết quả rất chính xác. Nó chỉ có ý nghĩa đối với tôi nếu điều này được sử dụng để tìm phạm vi nhỏ hơn, giả sử sau đó chúng tôi biết chi phí tốt nhất là 2 ^ 3 và sau đó chúng tôi tìm kiếm xung quanh đó. Nhưng không nơi nào đề cập đến được thực hiện theo cách đó.