Lý thuyết học PAC có nghĩa là gì?


15

Tôi là người mới trong học máy. Tôi đang học một khóa học về máy học (Đại học Stanford) và tôi không hiểu ý nghĩa của lý thuyết này là gì và tiện ích của nó là gì. Tôi tự hỏi nếu ai đó có thể chi tiết lý thuyết này cho tôi.

Lý thuyết này dựa trên phương trình này. nhập mô tả hình ảnh ở đây


2
PAC là viết tắt của Có lẽ gần đúng.
Marc Claesen

@MarcClaesen, tôi có thể giải thích như thế này không: "Điều đó có nghĩa là phương pháp tiếp cận máy học cung cấp giải pháp xác suất cho một vấn đề nhất định và giải pháp này có xu hướng chính xác gần đúng"
BetterEnglish 22/03/2015

Câu trả lời:


16

Có lẽ lý thuyết học tập gần đúng (PAC) giúp phân tích xem liệu trong những điều kiện nào, người học có thể sẽ đưa ra một phân loại xấp xỉ chính xác. (Bạn sẽ thấy một số nguồn sử dụng A thay cho L. )LAL

Đầu tiên, hãy định nghĩa "gần đúng." Một giả thuyết xấp xỉ đúng nếu lỗi mang về bàn thắng phân phối đầu vào được bao bọc bởi một số ε , 0 ε 1hHTức là,errorD(h)<ε, nơiDlà phân phối qua đầu vào.ϵ,0ϵ12.errorD(h)<ϵD

Tiếp theo, "có lẽ." Nếu sẽ ra một phân loại như vậy với xác suất 1 - δ , với 0 δ 1L1δ , chúng tôi gọi đó là phân loạicó lẽgần đúng.0δ12

Biết rằng một khái niệm mục tiêu là PAC có thể học được cho phép bạn ràng buộc kích thước mẫu cần thiết để có thể tìm hiểu một bộ phân loại chính xác, đó là những gì được thể hiện trong công thức bạn đã sao chép:

m1ϵ(ln|H|+ln1δ)

Để có được một số trực giác về điều này, hãy lưu ý các hiệu ứng trên khi bạn thay đổi các biến ở phía bên tay phải. Khi sai số cho phép giảm , kích thước mẫu cần thiết tăng lên. Tương tự như vậy, nó phát triển với khả năng của một người học xấp xỉ chính xác, và với kích thước của không gian giả thuyết H . (Một cách lỏng lẻo, một không gian giả thuyết là tập hợp các phân loại mà thuật toán của bạn xem xét.) Nói rõ hơn, khi bạn xem xét các phân loại có thể hơn, hoặc muốn có lỗi thấp hơn hoặc xác suất chính xác cao hơn, bạn cần nhiều dữ liệu hơn để phân biệt giữa chúng.mH

Đối với nhiều hơn, video này và các video liên quan khác có thể hữu ích, chẳng hạn như phần giới thiệu dài dòng này hoặc một trong nhiều văn bản học máy , ví dụ như Mitchell .


Đây loại câu trả lời tôi đã tìm kiếm trong một thời gian dài; vừa đơn giản nhưng âm thanh. Mặc dù nhiều nguồn sẽ cung cấp một câu trả lời mở rộng, nó không được ưa thích để tham khảo nhanh.
Ébe Isaac

3


(xi,yi)xiyix~y~
Nói 1.000.000 dù. Nếu bạn được cấp thứ tự 1,2,3, ... 999.999, người ta sẽ chắc chắn rằng số tiếp theo là 1.000.000. Tuy nhiên, số tiếp theo có thể là 999.999,5 hoặc thậm chí 5. Điểm quan trọng là càng nhiều dữ liệu người ta nhìn thấy, người ta càng có thể chắc chắn rằng người ta đã tạo ra một mô hình chính xác, nhưng người ta không bao giờ có thể chắc chắn tuyệt đối.

xi,1imyifθfΘp>1δfΘϵ(δ,ϵ)(δ,ϵ) và mức độ phức tạp của lớp giả thuyết đã cho.

Hfθ(ϵ,δ)0<ϵ,δ,<.5fΘx~,y~Err(fΘ(x~),y~)<ϵp>1δm=m(δ,ϵ,H)(fΘ(x~)y~)2

(δ,ϵ)

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.