Hình chữ nhật song song trục học PAC


7

Tôi đang cố gắng để hiểu bằng chứng rằng các hình chữ nhật song song trục là PAC có thể học được trong trường hợp có thể thực hiện được. Điều này có nghĩa là đã choϵ,δcó đủ dữ liệu, chúng ta có thể tìm thấy một hàm sao cho Ở đây có thể thấy lỗi là xác suất gây ra lỗi với hàm đã chọn của chúng ta .h

P[error>ϵ]δ
h

Bây giờ, đối với các hình chữ nhật song song trục (trong phân loại nhị phân), đối số thông thường sẽ như thế này, hãy để là hình chữ nhật thật và đặt R ' là hình chữ nhật nhỏ nhất chứa các ví dụ tích cực, rõ ràng R' \ subseteq R , chúng tôi xem xét bốn dải hình chữ nhật giữa R'R . Rõ ràng nếu tất cả chúng đều có xác suất \ leq \ epsilon / 4 thì xác suất gây ra lỗi nhỏ hơn \ epsilon , vì vậy chúng ta có thể giả sử rằng ít nhất một người có xác suất mắc lỗi \ geq \ epsilon / 4 .RRR'RR'Rε/4εε/4

Đối với một dải như vậy, xác suất phân loại chính xác tất cả các ví dụ đào tạo m nhiều nhất là (1-ε/4)m , và do đó lấy một liên kết bị ràng buộc trên tất cả các dải chúng ta có được rằng xác suất phân loại chính xác mọi thứ nhỏ hơn 4(1-ε/4)m4e-m/4 , và với một chút đại số, điều này mang lại độ phức tạp của mẫu là m(4/ε)ln(4/δ) .

Đây là một bản pdf giải thích chi tiết hơn một chút, với một số hình ảnh, tôi chỉ cần cô đọng lại lập luận nhiều nhất có thể để phù hợp với nó ở đây.

Câu hỏi của tôi là, tại sao chúng ta phải xem xét bốn dải hình chữ nhật một cách riêng biệt, tại sao chúng ta không thể nói rằng xác suất của vùng giữa và phải lớn hơn (vì nếu không chúng ta đã hoàn thành) và do đó, bằng cách sử dụng cùng một đối số, chúng ta sẽ đi đến giới hạn tốt hơn ?R'Rεm(1/ε)ln(1/δ)

Xin lỗi vì câu hỏi dài, và cảm ơn trước.


Toán học đơn giản hơn nhiều. Làm thế nào bạn sẽ thay đổi bằng chứng để làm việc với hình chữ nhật?
randomsurfer_123

@ randomsurfer_123 Đó là điều. Tôi không thấy bằng chứng trong pdf mà tôi đề cập trong bài đăng sử dụng chúng là hình chữ nhật song song trục, tôi chỉ thấy họ tranh luận về xác suất của một điểm rơi trong khu vực giữa hình chữ nhật nhỏ và lớn. Tôi phải thiếu một cái gì đó, bởi vì nếu không thì điều này có thể được áp dụng cho các hình dạng khác.
alejopelaez

Câu trả lời:


1

Câu hỏi hơi mơ hồ, nhưng có vẻ như những gì bạn muốn tranh luận là dọc theo dòng này: Hãy R là khái niệm để học và lấy bất kỳ R*R là bất kỳ hình chữ nhật bao gồm một (1-ε)-phần của R. Sau đó với một số xác suấtR' sẽ chứa R*.

Vấn đề với điều này là xác suất cụ thể phụ thuộc vào sự lựa chọn cụ thể của R*. Tôi nghĩ những gì bạn bối rối là muốnR'để thực hiện tốt trên các ví dụ hình. Bằng cách xây dựngR'sẽ phân loại chính xác tất cả các dữ liệu đào tạo. Sự kiện tồi tệ thực sự là tất cả các dữ liệu đào tạo được tập trung trong một hình chữ nhật quá nhỏ; điều này xảy ra với xác suất nhiều nhất là sự kiện mà một trong các dải bị bỏ sót bởi tất cả các ví dụ đào tạo.


0

hmm ... tốt, trong bằng chứng bạn đề cập, chúng tôi rút ra các điểm (x, y) từ một số phân phối D và kiểm tra xem chúng có thực sự rơi vào một hình vuông không. Tức là chúng ta chọn giống nhauδcho mỗi ràng buộc (max x, min x, max y, min y). Bây giờ nếu bạn có một vòng tròn, bạn không thể làm điều đó - bạn phải chọn một delta cho bán kính và bán kính là một hàm tọa độ. Vì vậy, sẽ làm cho bằng chứng phức tạp hơn.

Nếu bạn đi cho đa giác không lõm - nó sẽ khó hơn nhiều.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.