Tôi đang cố gắng để hiểu bằng chứng rằng các hình chữ nhật song song trục là PAC có thể học được trong trường hợp có thể thực hiện được. Điều này có nghĩa là đã chocó đủ dữ liệu, chúng ta có thể tìm thấy một hàm sao cho Ở đây có thể thấy lỗi là xác suất gây ra lỗi với hàm đã chọn của chúng ta .
Bây giờ, đối với các hình chữ nhật song song trục (trong phân loại nhị phân), đối số thông thường sẽ như thế này, hãy để là hình chữ nhật thật và đặt R ' là hình chữ nhật nhỏ nhất chứa các ví dụ tích cực, rõ ràng R' \ subseteq R , chúng tôi xem xét bốn dải hình chữ nhật giữa R' và R . Rõ ràng nếu tất cả chúng đều có xác suất \ leq \ epsilon / 4 thì xác suất gây ra lỗi nhỏ hơn \ epsilon , vì vậy chúng ta có thể giả sử rằng ít nhất một người có xác suất mắc lỗi \ geq \ epsilon / 4 .
Đối với một dải như vậy, xác suất phân loại chính xác tất cả các ví dụ đào tạo nhiều nhất là , và do đó lấy một liên kết bị ràng buộc trên tất cả các dải chúng ta có được rằng xác suất phân loại chính xác mọi thứ nhỏ hơn , và với một chút đại số, điều này mang lại độ phức tạp của mẫu là .
Đây là một bản pdf giải thích chi tiết hơn một chút, với một số hình ảnh, tôi chỉ cần cô đọng lại lập luận nhiều nhất có thể để phù hợp với nó ở đây.
Câu hỏi của tôi là, tại sao chúng ta phải xem xét bốn dải hình chữ nhật một cách riêng biệt, tại sao chúng ta không thể nói rằng xác suất của vùng giữa và phải lớn hơn (vì nếu không chúng ta đã hoàn thành) và do đó, bằng cách sử dụng cùng một đối số, chúng ta sẽ đi đến giới hạn tốt hơn ?
Xin lỗi vì câu hỏi dài, và cảm ơn trước.