Một tìm kiếm lưới SVM có nên hiển thị vùng có độ chính xác cao với độ chính xác thấp xung quanh không?


12

Tôi có 12 bộ huấn luyện tích cực (tế bào ung thư được điều trị bằng thuốc với mỗi 12 cơ chế hoạt động khác nhau). Đối với mỗi bộ đào tạo tích cực này, tôi muốn đào tạo một máy vectơ hỗ trợ để phân biệt nó với một bộ âm có kích thước bằng nhau được lấy mẫu từ thử nghiệm. Mỗi bộ có từ 1000 đến 6000 ô và có 476 tính năng (tính năng hình ảnh) của mỗi ô, mỗi ô được chia tỷ lệ tuyến tính thành [0, 1].

Tôi sử dụng LIBSVM và hạt nhân Gaussian RGB. Sử dụng phép định giá chéo năm lần, tôi đã thực hiện tìm kiếm lưới cho log C ∈ [-5, 15] và log₂ [-15, 3]. Kết quả như sau:

Kết quả tìm kiếm lưới

Tôi đã thất vọng vì không có một bộ thông số nào mang lại độ chính xác cao cho tất cả 12 vấn đề phân loại. Tôi cũng ngạc nhiên khi các lưới thường không hiển thị vùng có độ chính xác cao được bao quanh bởi độ chính xác thấp hơn. Có phải điều này chỉ có nghĩa là tôi cần mở rộng không gian tham số tìm kiếm, hoặc là tìm kiếm dạng lưới cho thấy có gì đó không đúng?


2
Re thất vọng: Bạn sẽ không mong đợi từng vấn đề để có thông số tương tự, vậy tại sao sẽ bạn mong đợi các vấn đề với các giá trị cổ phiếu tốt cho các siêu (log gamma và C)?
liên hợp chiến binh

@Conjugate Trước: Các tập huấn luyện là tập hợp con của cùng một thí nghiệm và các tập huấn luyện âm tính được lấy mẫu từ cùng một quần thể, vì vậy tôi đã hy vọng rằng độ rộng hạt nhân RBF tương tự ɣ sẽ có hiệu quả. Bởi vì các tập hợp tích cực đang bị phân biệt đối xử từ cùng một dân số (tiêu cực), tôi đã hy vọng rằng hình phạt C lý tưởng cũng sẽ tương tự. Nếu đây không phải là trường hợp, nó làm cho SVM thực sự khó áp dụng. Tăng nhẹ nhàng, ví dụ, có vẻ dễ điều chỉnh hơn nhiều.
Vebjorn Ljosa

Aha. Nhưng dường như đối với tôi, mặc dù đó là cùng một thử nghiệm theo nghĩa vật lý, tuy nhiên bạn vẫn đang tấn công các vấn đề riêng biệt và khác nhau theo nghĩa thống kê. Đặc biệt nếu các trường hợp tiêu cực được điều chỉnh lại cho mỗi điều trị.
liên hợp chiến binh

1
BTW, tìm kiếm lưới khá kém hiệu quả, thuật toán tối ưu hóa đơn giản Nelder-Mead rất hiệu quả, cũng như các phương pháp tối ưu hóa giảm dần độ dốc. Tìm kiếm lưới là đơn giản, nhưng một chút "sức mạnh vũ phu".
Dikran Marsupial

@Vebjorn Ljosa (một năm sau), 5 giá trị phân tán bao nhiêu, nói gì ở trận chung kết (C, gamma)? Có phải tất cả 12 lô đều được chia tỷ lệ giống nhau, ví dụ 50% .. dự đoán đúng 100%? Cảm ơn
chối

Câu trả lời:


9

Các giá trị tối ưu cho các tham số siêu sẽ khác nhau đối với các taks học khác nhau, bạn cần điều chỉnh chúng riêng cho mọi vấn đề.

Lý do bạn không nhận được một tối ưu duy nhất là vì cả tham số kernel và tham số chính quy kiểm soát độ phức tạp của mô hình. Nếu C nhỏ, bạn có được một mô hình trơn tru, tương tự như vậy, nếu hạt nhân rộng, bạn sẽ có được một mô hình trơn tru (vì các hàm cơ bản không phải là rất cục bộ). Điều này có nghĩa là sự kết hợp khác nhau của C và chiều rộng hạt nhân dẫn đến các mô hình phức tạp tương tự nhau, với hiệu suất tương tự (đó là lý do tại sao bạn có được tính năng đường chéo trong nhiều ô bạn có).

Tối ưu cũng phụ thuộc vào mẫu cụ thể của tập huấn luyện. Có thể quá phù hợp với lỗi xác thực chéo, do đó, việc chọn các tham số siêu bằng cách xác thực chéo có thể thực sự làm cho hiệu suất kém hơn nếu bạn không may mắn. Xem Cawley và Talbot cho một số thảo luận về điều này.

Thực tế là có rất nhiều giá trị cho các tham số siêu mà bạn nhận được các giá trị tốt tương tự thực sự là một tính năng tốt của các máy vectơ hỗ trợ vì nó cho thấy rằng chúng không quá dễ bị phù hợp với lựa chọn mô hình. Nếu bạn có một đỉnh sắc nét ở các giá trị tối ưu, đó sẽ là một điều tồi tệ vì cực đại sẽ khó tìm thấy bằng cách sử dụng một bộ dữ liệu hữu hạn sẽ cung cấp một dấu hiệu không đáng tin cậy về nơi mà đỉnh đó thực sự nằm.


BTW Tôi đang thực hiện một nghiên cứu về sự phù hợp quá mức trong lựa chọn mô hình bằng cách sử dụng tìm kiếm dạng lưới, điều này hóa ra thú vị hơn nhiều mà tôi đã nghĩ. Ngay cả với một vài tham số siêu, bạn vẫn có thể phù hợp quá mức với tiêu chí lựa chọn mô hình nếu bạn tối ưu hóa qua lưới mà nó quá ổn!
Dikran Marsupial

Bây giờ tôi sẽ kết thúc công việc mô phỏng, hy vọng tôi sẽ có thể gửi bài trong một hoặc hai tháng ...
Dikran Marsupial

Tôi có muốn đọc tờ giấy đó nếu nó được hoàn thành? Tôi đã bắt gặp một số đột biến lạ v.v ... trong tối ưu hóa tìm kiếm lưới có vẻ giống với những gì bạn thảo luận ở đây.
BGreene

Tất cả các công việc mô phỏng hiện đã hoàn tất, tôi chỉ đang đặt tờ giấy vào lúc này (chủ yếu chỉ đảm bảo rằng nó hoàn toàn có thể tái tạo được). Tôi đã lưu tất cả các lưới để một số phân tích lại có thể xem xét các câu hỏi khác mà tôi không nghĩ đến vào lúc đó.
Dikran Marsupial
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.