Tôi có một phân loại nhị phân (học có giám sát) vấn đề, nơi mà tất cả các tính năng của tôi là boolean, với xoắn sau: Tôi muốn học một phân loại mà là đơn điệu . Nói cách khác, thay đổi bất kỳ tập hợp con các tính năng từ 0 thành 1 sẽ không bao giờ thay đổi đầu ra của trình phân loại từ 1 thành 0.
Làm thế nào tôi có thể học một bộ phân loại đơn điệu ? Tôi có thể điều chỉnh các phương pháp phân loại tiêu chuẩn bằng cách nào đó, để thực thi các ràng buộc đơn điệu không?
Tôi có thể thấy cách điều chỉnh hồi quy logistic theo cách đảm bảo nó sẽ học được mô hình đơn điệu: chúng ta có thể yêu cầu mỗi hệ số tính năng không âm, sau đó áp dụng thuật toán tối ưu hóa bị ràng buộc để suy ra các hệ số của mô hình. Có cách nào hợp lý để điều chỉnh các chương trình học có giám sát khác (ví dụ, rừng ngẫu nhiên, tăng cường độ dốc, mạng lưới thần kinh) không? Hoặc có những thuật toán chuyên dụng phù hợp cho tình huống này?
Thật không may, chỉ áp dụng một trình phân loại rừng ngẫu nhiên tiêu chuẩn không được đảm bảo để mang lại một trình phân loại đơn điệu, ngay cả khi tập huấn luyện là đơn điệu (nó xuất phát từ một cài đặt đơn điệu và không có tiếng ồn hoặc vi phạm tính đơn điệu). Xem https://cs.stackexchange.com/q/69220/755 để biết ví dụ rõ ràng, ví dụ: tập huấn luyện đơn điệu, trong đó các khu rừng ngẫu nhiên có thể học một trình phân loại không đơn điệu - mặc dù có tồn tại một trình phân loại đơn điệu điều đó cũng tốt không kém Điều này cho thấy rằng chúng ta có thể cần một số kỹ thuật phức tạp hơn nếu chúng ta muốn tìm hiểu một trình phân loại đơn điệu.