Có lẽ một trường hợp đơn giản hơn sẽ làm cho mọi thứ rõ ràng hơn. Hãy nói rằng chúng tôi chọn một mẫu pixel 1x2 thay vì 100x100.
Mẫu pixel từ hình ảnh
+----+----+
| x1 | x2 |
+----+----+
Hãy tưởng tượng khi vẽ sơ đồ tập huấn luyện của chúng tôi, chúng tôi nhận thấy rằng nó không thể tách rời dễ dàng bằng mô hình tuyến tính, vì vậy chúng tôi chọn thêm các thuật ngữ đa thức để phù hợp hơn với dữ liệu.
Giả sử, chúng tôi quyết định xây dựng các đa thức của chúng tôi bằng cách bao gồm tất cả các cường độ pixel và tất cả các bội số có thể có thể được hình thành từ chúng.
Vì ma trận của chúng ta nhỏ, hãy liệt kê chúng:
x1, x2, x21, x22, x1×x2, x2×x1
Giải thích chuỗi các tính năng trên có thể thấy rằng có một mẫu. Hai thuật ngữ đầu tiên, nhóm 1, là các tính năng chỉ bao gồm cường độ pixel của chúng. Hai thuật ngữ sau đây, nhóm 2, là các tính năng bao gồm bình phương cường độ của chúng. Hai thuật ngữ cuối cùng, nhóm 3, là sản phẩm của tất cả các kết hợp cường độ pixel theo cặp (hai).
nhóm 1: x1, x2
nhóm 2: x21, x22
nhóm 3: x1×x2, x2×x1
Nhưng chờ đã, có một vấn đề. Nếu bạn nhìn vào các thuật ngữ nhóm 3 trong chuỗi ( và x 2 × x 1 ) bạn sẽ nhận thấy rằng chúng bằng nhau. Ghi nhớ ví dụ nhà ở của chúng tôi. Hãy tưởng tượng có hai tính năng x1 = cảnh vuông và x2 = cảnh vuông, cho cùng một ngôi nhà ... Điều đó không có ý nghĩa gì! Ok, vì vậy chúng ta cần loại bỏ tính năng trùng lặp, giả sử tùy ý x 2 × x 1 . Bây giờ chúng ta có thể viết lại danh sách các tính năng của nhóm ba như:x1×x2x2×x1x2×x1
nhóm 3: x1×x2
Chúng tôi đếm các tính năng trong cả ba nhóm và nhận được 5.
Nhưng đây là một ví dụ đồ chơi. Cho phép rút ra một công thức chung để tính số lượng tính năng. Hãy sử dụng các nhóm tính năng ban đầu của chúng tôi làm điểm bắt đầu.
sizegroup1+sizegroup2+sizegroup3=m×n+m×n+m×n=3×m×n
Ah! Nhưng chúng tôi đã phải loại bỏ sản phẩm trùng lặp trong nhóm 3.
C(m×n,2)
Vì vậy, công thức chung của chúng tôi sẽ là:
m×n+m×n+C(m×n,2)=2m×n+C(m×n,2)
Hãy sử dụng nó để tính toán số lượng tính năng trong ví dụ đồ chơi của chúng tôi:
2×1×2+C(1×2,2)=4+1=5
Đó là nó!