Kết hợp đặc tính học tập chính xác với các truy vấn thành viên


15

Chỉnh sửa: Vì tôi chưa nhận được bất kỳ phản hồi / nhận xét nào trong một tuần, tôi muốn nói thêm rằng tôi rất vui khi nghe bất cứ điều gì về vấn đề này. Tôi không làm việc trong khu vực, vì vậy ngay cả khi đó là một quan sát đơn giản, tôi có thể không biết điều đó. Ngay cả một nhận xét như "Tôi làm việc trong khu vực, nhưng tôi chưa thấy một đặc tính như thế này" sẽ hữu ích!

Lý lịch:

Có một số mô hình học tập được nghiên cứu kỹ về lý thuyết học tập (ví dụ: học PAC, học trực tuyến, học chính xác với các truy vấn thành viên / tương đương).

Ví dụ, trong học tập PAC, độ phức tạp mẫu của một lớp khái niệm có một đặc tính tổ hợp tốt về mặt kích thước VC của lớp. Vì vậy, nếu chúng ta muốn học một lớp với độ chính xác và độ tin cậy không đổi, điều này có thể được thực hiện với các mẫu , trong đó d là kích thước VC. (Lưu ý rằng chúng ta đang nói về độ phức tạp của mẫu, không phải độ phức tạp của thời gian.) Ngoài ra còn có một đặc tính tinh tế hơn về độ chính xác và độ tin cậy. Tương tự, mô hình ràng buộc sai lầm của học tập trực tuyến có một đặc tính tổ hợp tốt đẹp.Θ(d)d

Câu hỏi:

Tôi muốn biết nếu một kết quả tương tự được biết đến với mô hình học tập chính xác với các truy vấn thành viên. Mô hình được định nghĩa như sau: Chúng tôi có quyền truy cập vào hộp đen mà trên đầu vào cung cấp cho bạn f ( x ) . Chúng ta biết e xuất phát từ một số khái niệm lớp C . Chúng tôi muốn xác định f với càng ít truy vấn càng tốt.xf(x)fCf

Có một tham số kết hợp của một lớp khái niệm đặc trưng cho số lượng truy vấn cần thiết để tìm hiểu một khái niệm trong mô hình học tập chính xác với các truy vấn thành viên không?C

Những gì tôi biết:

Đặc tính tốt nhất mà tôi đã tìm thấy là trong bài báo này của Servedio và Gortler , sử dụng một tham số mà họ gán cho Bshouty, Cleve, Gavaldà, Kannan và Tamon . Họ xác định một tham số tổ hợp gọi là , nơi C là lớp khái niệm, trong đó có các thuộc tính sau. (Đặt Q C là số lượng truy vấn tối ưu cần thiết để tìm hiểu C trong mô hình này.)γCCQCC

QC=Ω(1/γC)QC=Ω(log|C|)QC=O(log|C|/γC)

Đặc tính này là gần như chặt chẽ. Tuy nhiên, có thể có một khoảng cách bậc hai giữa giới hạn trên và dưới. Ví dụ, nếu , thì giới hạn dưới là Ω ( k ) , nhưng giới hạn trên là O ( k 2 ) . (Tôi cũng nghĩ rằng khoảng cách này là có thể đạt được, nghĩa là, tồn tại một lớp khái niệm mà giới hạn dưới là cả Ω ( k ) , nhưng giới hạn trên là O ( k 2 ) .)1/γC=log|C|=kΩ(k)O(k2)Ω(k)O(k2)


1
"Kích thước Haystack" đặc trưng cho độ phức tạp truy vấn của việc tối ưu hóa một chức năng: cis.upenn.edu/~mkearns/ con / hahstack.pdf , Điều này khác với những gì bạn muốn, nhưng bạn có thể thích công việc liên quan thảo luận về những gì được biết về đặc tính sự phức tạp truy vấn của việc học chính xác.
Aaron Roth

Câu trả lời:


6

Để lái xe về điểm ví dụ của nai sừng vô danh, hãy xem xét lớp khái niệm bao gồm các hàm chỉ xuất 1 trên một điểm trong {0,1} ^ n. Lớp có kích thước 2 ^ n và 2 ^ n truy vấn là cần thiết trong trường hợp xấu nhất. Hãy xem Kích thước giảng dạy trong trường hợp xấu nhất (Goldman & Schapire) cung cấp một cái gì đó tương tự như những gì bạn đang tìm kiếm.


1
Cảm ơn! Tìm kiếm Kích thước giảng dạy đã đưa tôi đến Kích thước giảng dạy mở rộng, tương tự như tham số tổ hợp tôi đã đề cập trong câu hỏi, sau đó dẫn tôi đến nhiều bài viết thú vị khác về chủ đề này.
Robin Kothari

4

Tôi không biết về một đặc tính như vậy. Tuy nhiên, đáng lưu ý rằng đối với hầu hết mọi lớp khái niệm, người ta cần truy vấn tất cả các điểm. Để thấy điều này, hãy xem xét lớp khái niệm bao gồm tất cả các vectơ bool n chiều có trọng số Hamming 1. Lớp khái niệm này rõ ràng yêu cầu n truy vấn để tìm hiểu, bằng với số lượng thẻ của nó. Bạn có thể có thể khái quát hóa quan sát này để có được rằng hầu như bất kỳ lớp khái niệm nào cũng yêu cầu thực hiện tất cả các truy vấn.

Tôi nghi ngờ rằng đã đưa ra một khái niệm lớp C làm đầu vào, thật khó để xác định mức độ phức tạp của việc học chính xác lớp khái niệm với các truy vấn thành viên, hoặc thậm chí để ước tính nó là một hằng số. Điều này sẽ đưa ra một số dấu hiệu cho thấy một đặc tính tổ hợp "tốt" không tồn tại. Nếu bạn muốn chứng minh một kết quả độ cứng NP như vậy nhưng hãy thử và không cảm thấy thoải mái khi đăng ở đây và tôi sẽ xem liệu tôi có thể tìm ra nó không (tôi có một số ý tưởng).


1
Cảm ơn vì sự trả lời. Ngay cả khi sự thật là hầu như tất cả các lớp khái niệm (dưới một số phân phối hợp lý trên các lớp) đều khó học, một số lớp rất dễ học và sẽ rất thú vị khi có một tham số kết hợp đặc trưng cho điều này. Tôi không phiền nếu tham số khó tính. Ngay cả kích thước VC cũng không được biết là có thể tính toán hiệu quả.
Robin Kothari

1

Mặc dù những người khác đã chỉ ra câu trả lời. Tôi nghĩ rằng tôi có thể làm cho nó khép kín và chỉ ra tại sao chiều giảng dạy là câu trả lời.

CXSXffCS

T(f)f(f,C)=min{ |S| | ST(f)}fmin(f)T(f)(C)=fC(f,C)C

f(f,C)min(f)(C)f


fff

@RobinKothari TD giới hạn số lượng truy vấn tối thiểu trong bất kỳ thuật toán MQ nào. Trong thực tế, có thể không có thuật toán nào đạt được một cách mù quáng ràng buộc này mà không gian lận hoặc thủ thuật mã. Trong bài báo "Truy vấn truy vấn" của Angluin, cô đã thảo luận về một tham số gọi là MQ đại diện cho số lượng truy vấn cần thiết bởi thuật toán MQ tốt nhất trong trường hợp xấu nhất. Tôi không nhớ chi tiết của nó nhưng chắc chắn TD <= MQ.
seteropere

1
Điều tôi quan tâm (khi tôi hỏi câu hỏi này) là một tham số đặc trưng cho việc học chính xác với các truy vấn thành viên. Nó nên là cả một giới hạn trên và dưới. Tôi đã cung cấp một ví dụ về một tham số đạt được điều này (tối đa một bản ghi | C | yếu tố) trong câu hỏi. Câu hỏi của tôi là liệu một cái gì đó tốt hơn được biết đến.
Robin Kothari
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.