Bảng 18.1 trong Các yếu tố của học thống kê tóm tắt hiệu suất của một số phân loại trên tập dữ liệu 14 lớp. Tôi đang so sánh một thuật toán mới với lasso và lưới đàn hồi cho các vấn đề phân loại đa lớp như vậy.
Sử dụng glmnet
phiên bản 1.5.3 (R 2.13.0) Tôi không thể sao chép điểm 7. ( đa thức đa cấp ) trong bảng, trong đó số lượng gen được sử dụng được báo cáo là 269 và lỗi kiểm tra là 13 trong số 54. Dữ liệu được sử dụng là bộ dữ liệu microarray 14 ung thư này . Bất cứ điều gì tôi đã thử, tôi đều có được một mô hình hoạt động tốt nhất bằng cách sử dụng trong vùng lân cận 170-180 gen với lỗi kiểm tra là 16 trên 54.
Lưu ý rằng ở đầu Mục 18.3, trên trang 654, một số tiền xử lý dữ liệu được mô tả.
Tôi đã liên hệ với các tác giả - cho đến nay mà không có phản hồi - và tôi hỏi liệu có ai có thể xác nhận rằng có vấn đề trong việc sao chép bảng hoặc cung cấp giải pháp về cách tái tạo bảng không.