Tôi đang học máy học từ các bài giảng của Andrew Ng Stanford và tìm hiểu lý thuyết về kích thước của VC. Theo các bài giảng và những gì tôi hiểu, định nghĩa về kích thước VC có thể được đưa ra là,
Nếu bạn có thể tìm thấy một tập hợp điểm, thì nó có thể bị phá vỡ bởi trình phân loại (nghĩa là phân loại chính xác tất cả các nhãn 2 n có thể ) và bạn không thể tìm thấy bất kỳ tập hợp n + 1 điểm nào có thể bị phá vỡ (ví dụ: đối với bất kỳ tập hợp nào của n + 1 điểm có ít nhất một thứ tự ghi nhãn để bộ phân loại không thể tách tất cả các điểm một cách chính xác), thì kích thước VC là n .
Giáo sư cũng lấy một ví dụ và giải thích điều này một cách độc đáo. Đó là:
Để cho,
Sau đó, bất kỳ 3 điểm có thể được phân loại bởi chính xác với mặt phẳng siêu phân cách như trong hình dưới đây.
Và đó là lý do tại sao kích thước VC của là 3. Bởi vì đối với bất kỳ 4 điểm nào trong mặt phẳng 2D, một bộ phân loại tuyến tính không thể phá vỡ tất cả các kết hợp của các điểm. Ví dụ,
Đối với tập hợp các điểm này, không có mặt phẳng siêu phân tách nào có thể được vẽ để phân loại tập hợp này. Vậy kích thước VC là 3.
Tôi có ý tưởng cho đến đây. Nhưng nếu chúng ta làm theo kiểu mẫu thì sao?
Hoặc mẫu có ba điểm trùng nhau, Ở đây chúng ta cũng không thể vẽ siêu phẳng tách biệt giữa 3 điểm. Nhưng mẫu này vẫn chưa được xem xét trong định nghĩa về kích thước VC. Tại sao? Điểm tương tự cũng được thảo luận về các bài giảng tôi đang xem Ở đây lúc 16:24 nhưng giáo sư không đề cập đến lý do chính xác đằng sau điều này.
Bất kỳ ví dụ trực quan của lời giải thích sẽ được đánh giá cao. Cảm ơn