Định nghĩa chính xác của kích thước VC là gì?


8

Tôi đang học máy học từ các bài giảng của Andrew Ng Stanford và tìm hiểu lý thuyết về kích thước của VC. Theo các bài giảng và những gì tôi hiểu, định nghĩa về kích thước VC có thể được đưa ra là,

Nếu bạn có thể tìm thấy một tập hợp điểm, thì nó có thể bị phá vỡ bởi trình phân loại (nghĩa là phân loại chính xác tất cả các nhãn 2 n có thể ) và bạn không thể tìm thấy bất kỳ tập hợp n + 1 điểm nào có thể bị phá vỡ (ví dụ: đối với bất kỳ tập hợp nào của n + 1 điểm có ít nhất một thứ tự ghi nhãn để bộ phân loại không thể tách tất cả các điểm một cách chính xác), thì kích thước VC là n .n2nn+1n+1n

Giáo sư cũng lấy một ví dụ và giải thích điều này một cách độc đáo. Đó là:

Để cho,

H= ={Set of tôiTôinemộtr ctôimộtSSTôifTôierS Tôin 2 DTôimenSTôionS}

Sau đó, bất kỳ 3 điểm có thể được phân loại bởi H chính xác với mặt phẳng siêu phân cách như trong hình dưới đây.

nhập mô tả hình ảnh ở đây

Và đó là lý do tại sao kích thước VC của H là 3. Bởi vì đối với bất kỳ 4 điểm nào trong mặt phẳng 2D, một bộ phân loại tuyến tính không thể phá vỡ tất cả các kết hợp của các điểm. Ví dụ,

nhập mô tả hình ảnh ở đây

Đối với tập hợp các điểm này, không có mặt phẳng siêu phân tách nào có thể được vẽ để phân loại tập hợp này. Vậy kích thước VC là 3.

Tôi có ý tưởng cho đến đây. Nhưng nếu chúng ta làm theo kiểu mẫu thì sao?

nhập mô tả hình ảnh ở đây

Hoặc mẫu có ba điểm trùng nhau, Ở đây chúng ta cũng không thể vẽ siêu phẳng tách biệt giữa 3 điểm. Nhưng mẫu này vẫn chưa được xem xét trong định nghĩa về kích thước VC. Tại sao? Điểm tương tự cũng được thảo luận về các bài giảng tôi đang xem Ở đây lúc 16:24 nhưng giáo sư không đề cập đến lý do chính xác đằng sau điều này.

Bất kỳ ví dụ trực quan của lời giải thích sẽ được đánh giá cao. Cảm ơn


Câu trả lời:


9

Định nghĩa về kích thước VC là: nếu tồn tại một tập hợp n điểm có thể bị phá vỡ bởi trình phân loại và không có điểm n + 1 nào có thể bị phá vỡ bởi trình phân loại, thì kích thước VC của trình phân loại là n.

Định nghĩa không nói: nếu bất kỳ tập hợp n điểm nào có thể bị phá vỡ bởi trình phân loại ...

Nếu kích thước VC của bộ phân loại là 3, thì nó không phải phá vỡ tất cả các sắp xếp có thể là 3 điểm.

Nếu trong tất cả các sắp xếp 3 điểm, bạn có thể tìm thấy ít nhất một sắp xếp như vậy có thể bị phá vỡ bởi trình phân loại và không thể tìm thấy 4 điểm có thể bị phá vỡ, thì kích thước VC là 3.


1
Sau đó, trong trường hợp này, chúng ta có thể nhận được ít nhất một mẫu của bất kỳ số điểm nào có thể được phân loại theo đường thẳng. Ví dụ nghĩ về 4 điểm. Hai điểm màu đỏ ở phía bên trái và hai điểm màu xanh ở phía bên phải sẽ giúp phân loại và kích thước của VC sẽ là 4. Vậy tại sao điều này không được xem xét?
Kaushal28

Phân loại - có. Tan vỡ - không
Vladislav Gladkikh

Vì vậy, ý nghĩa của việc phá vỡ một sự sắp xếp các điểm là gì? Tôi thực sự bối rối ở đây. Cảm ơn
Kaushal28

Một sự sắp xếp các điểm có thể bị phá vỡ nếu bất kỳ tập hợp con nào của sự sắp xếp này có thể được tách ra và đưa vào một lớp. Giả sử, bạn muốn kiểm tra xem một sắp xếp nào đó (không phải tất cả các sắp xếp có thể nhưng chỉ một sắp xếp cụ thể) của n điểm có thể bị phá vỡ bởi một loại phân loại nhất định. Sau đó, bạn kiểm tra đầu tiên nếu bất kỳ điểm duy nhất có thể được cô lập. Sau đó, nếu có thể tách biệt 2 điểm, thì nếu có 3 điểm, v.v., cho đến bất kỳ điểm n-1 nào của sự sắp xếp cụ thể đó. Xem tại đây en.wikipedia.org/wiki/Shatter_set
Vladislav Gladkikh

1
Hình với 8 ô con là một minh họa rất tốt về những gì đang tan vỡ. Ở đây bạn có 3 điểm, 2 lớp, vì vậy 2 ^ 3 = 8 nhãn có thể có của 3 điểm này. Tất cả 8 nhãn có thể được thực hiện và cô lập với một dòng do đó bộ này có thể bị phá vỡ bởi một dòng. Hình có 4 điểm: nó có một số nhãn có thể được phân lập bằng một dòng (giả sử, hai bên trái màu đỏ, hai bên phải màu xanh) nhưng cũng có một nhãn không thể tách biệt với một dòng (như trong Hình: trên và màu xanh thấp hơn, trái và phải là trái). Vì nó có một nhãn không thể tách rời với một dòng, bộ này không bị phá vỡ.
Vladislav Gladkikh
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.