Vì vậy, tôi đã đọc bài báo trên SURF (Bay, Ess, Tuytelaars, Van Gool: Các tính năng mạnh mẽ tăng tốc (SURF) ) và tôi không thể hiểu đoạn này dưới đây:
Do sử dụng bộ lọc hộp và hình ảnh tích hợp, chúng tôi không phải lặp lại áp dụng cùng một bộ lọc cho đầu ra của lớp được lọc trước đó, mà thay vào đó có thể áp dụng bộ lọc hộp có kích thước bất kỳ với tốc độ chính xác trực tiếp trên ảnh gốc và thậm chí song song (mặc dù cái sau không được khai thác ở đây). Do đó, không gian tỷ lệ được phân tích bằng cách tăng kích thước bộ lọc thay vì lặp lại giảm kích thước hình ảnh, hình 4.
This is figure 4 in question.
PS: Bài viết có giải thích về hình ảnh tích hợp, tuy nhiên toàn bộ nội dung của bài viết dựa trên đoạn văn cụ thể ở trên. Nếu bất cứ ai đã đọc bài viết này, bạn có thể đề cập ngắn gọn những gì đang xảy ra ở đây. Toàn bộ lời giải thích toán học khá phức tạp để có một nắm bắt tốt trước tiên, vì vậy tôi cần một số trợ giúp. Cảm ơn.
Chỉnh sửa, một số vấn đề:
1.
Mỗi quãng tám được chia thành một số cấp tỷ lệ không đổi. Do tính chất rời rạc của hình ảnh tích phân, chênh lệch tỷ lệ tối thiểu giữa 2 thang đo tiếp theo phụ thuộc vào độ dài lo của các thùy dương hoặc âm của đạo hàm bậc hai một phần theo hướng đạo hàm (x hoặc y), được đặt thành a thứ ba của chiều dài kích thước bộ lọc. Đối với bộ lọc 9x9, độ dài lo này là 3. Đối với hai mức liên tiếp, chúng ta phải tăng kích thước này tối thiểu 2 pixel (một pixel ở mỗi bên) để giữ kích thước không đồng đều và do đó đảm bảo sự hiện diện của pixel trung tâm . Điều này dẫn đến việc tăng tổng kích thước mặt nạ lên 6 pixel (xem hình 5).
Figure 5
Tôi không thể hiểu ý nghĩa của các dòng trong bối cảnh nhất định.
Đối với hai cấp độ liên tiếp, chúng ta phải tăng kích thước này tối thiểu 2 pixel (một pixel ở mỗi bên) để giữ kích thước không đồng đều và do đó đảm bảo sự hiện diện của pixel trung tâm.
Tôi biết họ đang cố gắng làm một cái gì đó với độ dài của hình ảnh, nếu thậm chí họ đang cố làm cho nó trở nên kỳ lạ, để có một pixel trung tâm sẽ cho phép họ tính toán tối đa hoặc tối thiểu của độ dốc pixel. Tôi hơi iffy về ý nghĩa ngữ cảnh của nó.
2.
Để tính toán mô tả Haar wavelet được sử dụng.
.
3.
Sự cần thiết phải có một bộ lọc gần đúng là gì?
4. Tôi không có vấn đề gì với cách họ tìm ra kích thước của bộ lọc. Họ "đã làm" một cái gì đó theo kinh nghiệm. Tuy nhiên, tôi có một số vấn đề dai dẳng với dòng này
Đầu ra của bộ lọc 9x9, được giới thiệu trong phần trước, được coi là lớp tỷ lệ ban đầu, mà chúng ta sẽ gọi là thang đo s = 1,2 (xấp xỉ các dẫn xuất Gaussian với = 1,2).
Làm thế nào mà họ phát hiện ra giá trị của. Ngoài ra, cách tính tỷ lệ được thực hiện trong hình ảnh bên dưới. Lý do tôi nói về hình ảnh này là giá trị của việc s=1.2
tiếp tục lặp lại, mà không nêu rõ về nguồn gốc của nó.
5.
Ma trận Hessian được biểu thị theo L
đó là tích chập của gradient bậc hai của bộ lọc Gausssian và hình ảnh.
Tuy nhiên, định thức "gần đúng" được cho là chỉ chứa các thuật ngữ liên quan đến bộ lọc Gaussian bậc hai.
Giá trị của w
là:
Câu hỏi của tôi tại sao định thức được tính như thế ở trên, và mối quan hệ giữa ma trận Hessian và Hessian gần đúng là gì.