Làm thế nào để tính toán số lượng các tính năng dựa trên độ phân giải hình ảnh?


18

Chỉ cần phủ Giả thuyết phi tuyến Andrew Ng của thần kinh Netowrks, và chúng tôi đã có một câu hỏi nhiều lựa chọn để xác định số tính năng cho một hình ảnh có độ phân giải 100x100 của grescale cường độ.

Và câu trả lời là 50 triệu, x 10 75107

Tuy nhiên, trước đó cho hình ảnh tỷ lệ xám 50 x 50 pixel. số lượng tính năng là 50x50 (2500)

Tại sao nó sẽ là x 10 7 thay vì 10 , 000 ?510710,000

Tuy nhiên, ông nói bao gồm tất cả các thuật ngữ bậc hai ( ) là các tính năngxixj

Giả sử bạn đang học cách nhận biết ô tô từ hình ảnh 100 × 100 pixel (thang độ xám, không phải RGB). Đặt các tính năng là giá trị cường độ pixel. Nếu bạn huấn luyện hồi quy logistic bao gồm tất cả các thuật ngữ bậc hai ( ) làm các tính năng, bạn sẽ có bao nhiêu tính năng?xixj

và trong slide trước đó về 100x100, các tính năng bậc hai ( x x j ) = 3 triệu tính năng, nhưng tôi vẫn không thể đặt ngón tay vào kết nối.xixj

Câu trả lời:


16

Có lẽ một trường hợp đơn giản hơn sẽ làm cho mọi thứ rõ ràng hơn. Hãy nói rằng chúng tôi chọn một mẫu pixel 1x2 thay vì 100x100.

Mẫu pixel từ hình ảnh

+----+----+
| x1 | x2 |
+----+----+

Hãy tưởng tượng khi vẽ sơ đồ tập huấn luyện của chúng tôi, chúng tôi nhận thấy rằng nó không thể tách rời dễ dàng bằng mô hình tuyến tính, vì vậy chúng tôi chọn thêm các thuật ngữ đa thức để phù hợp hơn với dữ liệu.

Giả sử, chúng tôi quyết định xây dựng các đa thức của chúng tôi bằng cách bao gồm tất cả các cường độ pixel và tất cả các bội số có thể có thể được hình thành từ chúng.

Vì ma trận của chúng ta nhỏ, hãy liệt kê chúng:

x1, x2, x12, x22, x1×x2, x2×x1

Giải thích chuỗi các tính năng trên có thể thấy rằng có một mẫu. Hai thuật ngữ đầu tiên, nhóm 1, là các tính năng chỉ bao gồm cường độ pixel của chúng. Hai thuật ngữ sau đây, nhóm 2, là các tính năng bao gồm bình phương cường độ của chúng. Hai thuật ngữ cuối cùng, nhóm 3, là sản phẩm của tất cả các kết hợp cường độ pixel theo cặp (hai).

nhóm 1: x1, x2

nhóm 2: x12, x22

nhóm 3: x1×x2, x2×x1

Nhưng chờ đã, có một vấn đề. Nếu bạn nhìn vào các thuật ngữ nhóm 3 trong chuỗi ( x 2 × x 1 ) bạn sẽ nhận thấy rằng chúng bằng nhau. Ghi nhớ ví dụ nhà ở của chúng tôi. Hãy tưởng tượng có hai tính năng x1 = cảnh vuông và x2 = cảnh vuông, cho cùng một ngôi nhà ... Điều đó không có ý nghĩa gì! Ok, vì vậy chúng ta cần loại bỏ tính năng trùng lặp, giả sử tùy ý x 2 × x 1 . Bây giờ chúng ta có thể viết lại danh sách các tính năng của nhóm ba như:x1×x2x2×x1x2×x1

nhóm 3: x1×x2

Chúng tôi đếm các tính năng trong cả ba nhóm và nhận được 5.

Nhưng đây là một ví dụ đồ chơi. Cho phép rút ra một công thức chung để tính số lượng tính năng. Hãy sử dụng các nhóm tính năng ban đầu của chúng tôi làm điểm bắt đầu.

sizegroup1+sizegroup2+sizegroup3=m×n+m×n+m×n=3×m×n

Ah! Nhưng chúng tôi đã phải loại bỏ sản phẩm trùng lặp trong nhóm 3.

C(m×n,2)

Vì vậy, công thức chung của chúng tôi sẽ là:

m×n+m×n+C(m×n,2)=2m×n+C(m×n,2)

Hãy sử dụng nó để tính toán số lượng tính năng trong ví dụ đồ chơi của chúng tôi:

2×1×2+C(1×2,2)=4+1=5

Đó là nó!


2
Mong muốn lời giải thích này đã được đưa ra trong bài giảng!
Ian Walker-Sperber

Tôi tự hỏi làm thế nào chúng ta phải biết điều này trong khóa học mà không được giải thích
Mohammed Noureldin

6

Nếu bạn đang sử dụng tất cả các tính năng tuyến tính và bậc hai, tổng số được cho là:

100*100 + 100*100 + C(100*100,2) = 50015000
10000   + 10000   + 49995000     = 50015000
xi         xi^2       xixj

1
Bạn có thể giải thích thêm một chút không? bạn đang nói xi + xi ^ 2 + xixi? Là xi = 100, và xj = 100? tại sao cả xi và xi ^ 2 đều là 100 * 100? C (100 * 100,2) là gì?
Iancovici

4
(1) có tổng số 100 * 100 pixel, nếu bạn đang sử dụng cường độ làm tính năng, sẽ có tổng số 100 * 100 tính năng, đó là xi; và (ii) bạn cũng có thể sử dụng mật độ năng lượng như một tính năng, đó là (xi, xi) hoặc xi. ^ 2, vẫn là tổng số 100 * 100; cuối cùng (iii) nếu bạn sử dụng các tương quan giữa hai pixel, sẽ có tổng số cặp pixel C, đó là (xi, xj), C là sự kết hợp trong toán học ( mathworld.wolfram.com/Combination.html )
lennon 310

Cảm ơn, một câu hỏi cuối cùng là tại sao xi = xi ^ 2 trong bối cảnh này?
Iancovici

Tôi đã sử dụng xi để biểu thị pixel đơn lẻ và xi ^ 2 có nghĩa là sử dụng các cặp pixel giống nhau (xi, xi). Số lượng pixel đơn là cùng một cặp của cùng một pixel. Nó không có gì để làm với cường độ pixel. Xin lỗi vì sự nhầm lẫn.
lennon 310

Câu hỏi tương tự, một vài năm sau. Chúng ta không nên tính đến các giá trị cường độ có thể (từ 0 đến 255)?
albus_c

0

Ý tưởng về (x2) / 2 cũng có thể hoạt động để có được các tính năng bậc hai. Vậy nếu n = 2500, thì chúng ta biết rằng x (i) = 2500 và thay thế x trong công thức sẽ cho 50 triệu


2
tôi có được 25002/23 triệu, không phải 50triệu.
whuber

0

@whuber 50 triệu đến khi bạn có hình ảnh 100 * 100 pixel. trong đó hình vuông (100 * 100) = 100000000 (10 triệu) và hình vuông (100 * 100) / 2 = 5 triệu. Hy vọng câu trả lời này.


Đây là một câu trả lời cho một bình luận và không phải là một câu trả lời cho câu hỏi này.
Michael R. Chernick
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.