Tìm kiếm ngẫu nhiên có xác suất 95% tìm thấy sự kết hợp của các tham số trong phạm vi tối ưu 5% chỉ với 60 lần lặp. Ngoài ra so với các phương pháp khác, nó không sa lầy vào tối ưu cục bộ.
Kiểm tra bài đăng blog tuyệt vời này tại Dato của Alice Zheng, cụ thể là phần Thuật toán điều chỉnh siêu tham số .
Tôi yêu những bộ phim mà kẻ thua cuộc chiến thắng, và tôi yêu những bài học về máy học, nơi những giải pháp đơn giản được thể hiện là hiệu quả đáng ngạc nhiên. Đây là cốt truyện của Tìm kiếm ngẫu nhiên để tìm kiếm tối ưu hóa siêu tham số của Bergstra và Bengio. [...] Tìm kiếm ngẫu nhiên trước đây không được thực hiện nghiêm túc. Điều này là do nó không tìm kiếm trên tất cả các điểm lưới, vì vậy nó không thể đánh bại mức tối ưu được tìm thấy bởi tìm kiếm lưới. Nhưng sau đó đến cùng Bergstra và Bengio. Họ đã chỉ ra rằng, trong nhiều trường hợp đáng ngạc nhiên, tìm kiếm ngẫu nhiên thực hiện cũng như tìm kiếm lưới. Nói chung, thử 60 điểm ngẫu nhiên được lấy mẫu từ lưới dường như là đủ tốt.
Nhìn chung, có một lời giải thích xác suất đơn giản cho kết quả: đối với bất kỳ phân phối nào trên một không gian mẫu có cực đại hữu hạn, tối đa 60 quan sát ngẫu nhiên nằm trong 5% tối đa thực sự, với xác suất 95%. Điều đó có vẻ phức tạp, nhưng nó không phải là. Hãy tưởng tượng khoảng 5% xung quanh mức tối đa thực sự. Bây giờ hãy tưởng tượng rằng chúng ta lấy mẫu các điểm từ không gian của anh ta và xem liệu có bất kỳ điểm nào trong số đó hạ cánh trong mức tối đa đó không. Mỗi lần rút ngẫu nhiên có 5% cơ hội hạ cánh trong khoảng thời gian đó, nếu chúng tôi rút ra n điểm độc lập, thì xác suất tất cả chúng bỏ lỡ khoảng thời gian mong muốn là
(1−0.05)n. Vì vậy, xác suất mà ít nhất một trong số họ thành công trong việc đạt được khoảng thời gian là 1 trừ đi số lượng đó. Chúng tôi muốn ít nhất là 0,95 xác suất thành công. Để tìm ra số lần rút chúng ta cần, chỉ cần giải n trong phương trình:
1−(1−0.05)n>0.95
Chúng tôi nhận được . Ta-da!n⩾60
Đạo đức của câu chuyện là: nếu vùng siêu âm gần tối ưu chiếm ít nhất 5% bề mặt lưới, thì tìm kiếm ngẫu nhiên với 60 thử nghiệm sẽ tìm thấy vùng đó có xác suất cao.
Bạn có thể cải thiện cơ hội đó với số lượng thử nghiệm cao hơn.
Nói chung, nếu bạn có quá nhiều tham số để điều chỉnh, tìm kiếm lưới có thể trở nên không khả thi. Đó là khi tôi thử tìm kiếm ngẫu nhiên.