Tin nhắn mang về nhà:
Thật không may, văn bản bạn trích dẫn thay đổi hai điều giữa cách tiếp cận 1 và 2:
- Cách tiếp cận 2 thực hiện xác nhận chéo và lựa chọn / điều chỉnh / tối ưu hóa mô hình dựa trên dữ liệu
- Cách tiếp cận 1 không sử dụng xác nhận chéo, cũng như lựa chọn / điều chỉnh / tối ưu hóa mô hình dựa trên dữ liệu.
- Cách tiếp cận 3 xác thực chéo mà không cần lựa chọn / điều chỉnh / tối ưu hóa mô hình dựa trên dữ liệu là hoàn toàn khả thi (amd IMHO sẽ dẫn đến cái nhìn sâu sắc hơn) trong bối cảnh được thảo luận ở đây
- Cách tiếp cận 4, không có xác nhận chéo nhưng lựa chọn / điều chỉnh / tối ưu hóa mô hình dựa trên dữ liệu là có thể, nhưng phức tạp hơn để xây dựng.
IMHO, xác thực chéo và tối ưu hóa dựa trên dữ liệu là hai quyết định hoàn toàn khác nhau (và phần lớn độc lập) trong việc thiết lập chiến lược mô hình hóa của bạn. Kết nối duy nhất là bạn có thể sử dụng các ước tính xác thực chéo làm chức năng đích để tối ưu hóa. Nhưng có tồn tại các chức năng đích khác đã sẵn sàng để sử dụng và có những cách sử dụng khác cho ước tính xác thực chéo (quan trọng là bạn có thể sử dụng chúng để xác minh mô hình của mình, còn gọi là xác thực hoặc thử nghiệm)
Thật không may, thuật ngữ học máy là IMHO hiện đang là một mớ hỗn độn gợi ý các kết nối / nguyên nhân / phụ thuộc sai ở đây.
Khi bạn tìm cách tiếp cận 3 (xác thực chéo không phải để tối ưu hóa mà để đo hiệu suất mô hình), bạn sẽ thấy xác thực chéo "quyết định" so với đào tạo trên toàn bộ dữ liệu là phân đôi giả trong ngữ cảnh này: Khi sử dụng xác thực chéo để đo hiệu suất phân loại, số liệu xác thực chéo được sử dụng làm ước tính cho một mô hình được đào tạo trên toàn bộ tập dữ liệu. Tức là cách tiếp cận 3 bao gồm cách tiếp cận 1.
pcác tham số / hệ số của mô hình, nhưng những gì tối ưu hóa thực hiện là ước tính các tham số xa hơn, cái gọi là siêu đường kính. Nếu bạn mô tả quá trình điều chỉnh và tối ưu hóa điều chỉnh mô hình là tìm kiếm các tham số mô hình, thì tối ưu hóa siêu tham số này có nghĩa là không gian tìm kiếm lớn hơn rất nhiều được xem xét. Nói cách khác, trong cách tiếp cận 1 (và 3), bạn hạn chế không gian tìm kiếm bằng cách chỉ định các siêu đường kính đó. Tập dữ liệu trong thế giới thực của bạn có thể đủ lớn (chứa đủ thông tin) để cho phép khớp trong không gian tìm kiếm bị hạn chế đó, nhưng không đủ lớn để sửa tất cả các tham số đủ tốt trong không gian tìm kiếm lớn hơn của phương pháp 2 (và 4).
Trong thực tế, trong lĩnh vực của tôi, tôi rất thường xuyên phải đối phó với các tập dữ liệu quá nhỏ để cho phép mọi suy nghĩ về tối ưu hóa dựa trên dữ liệu. Vì vậy, tôi phải làm gì thay vào đó: Tôi sử dụng kiến thức miền của mình về các quy trình tạo dữ liệu và dữ liệu để quyết định mô hình nào phù hợp với bản chất vật lý của dữ liệu và ứng dụng. Và trong phạm vi này, tôi vẫn phải hạn chế độ phức tạp của mô hình.