Sự khác biệt giữa bộ lọc gaussian đơn giản và bộ lọc gaussian nhân với tổng các phần tử của nó là gì?


7
1 2 1                         1 2 1                    
2 4 2 (A)            (1/16) * 2 4 2  (B)
1 2 1                         1 2 1

Cả hai ma trận đều giống nhau ngoại trừ ma trận B được nhân với tổng các phần tử của nó. Khi kết hợp với một hình ảnh, chúng cho hình ảnh mờ gần giống nhau.

Sự khác biệt chính xác giữa chúng và khi nào chúng nên được sử dụng?


4
Câu trả lời rõ ràng: sự khác biệt giữa hai đầu ra là một yếu tố của 116vì bộ lọc là tuyến tính.
Jason R

Câu trả lời:


8

Cái ngoài cùng bên phải (nơi bạn chia cho tổng) đảm bảo rằng đầu ra của bộ lọc sẽ có cùng dải động với đầu vào.

Trên thực tế, hình ảnh mờ đầu ra không giống nhau vì giá trị pixel của chúng khác nhau. Bạn có cảm giác rằng chúng giống nhau vì phần mềm của bạn (tôi giả sử Matlab) sẽ ánh xạ lại các giá trị cường độ của các pixel thành một phạm vi có thể chấp nhận được bằng các màn hình thông thường, tức là các giá trị 8 bit trong khoảng từ 0 đến 255. Nếu bạn sử dụng nhiều hơn Phần mềm hoặc thư viện "gần với kim loại", sau đó bạn sẽ phải tự thực hiện thao tác này.

Phạm vi động dữ liệu

Phạm vi động của hình ảnh được cung cấp bởi các giá trị cường độ tối thiểu và tối đa có trong hình ảnh hoặc theo cường độ tối thiểu và tối đa có thể được biểu thị bằng định dạng kỹ thuật số được sử dụng để lưu trữ các giá trị cường độ. (Từ ngữ cảnh thường rõ ràng một trong những định nghĩa được sử dụng.)

Phạm vi điển hình là [2,255] (với khoảng cách số nguyên) tương ứng với lượng tử hóa 8 bit và [0,1]cho các giá trị dấu phẩy động (độ chính xác đơn hoặc kép). Quy ước tương tự được sử dụng trong Đồ họa máy tính, OpenGL, v.v.

Nếu bạn chụp ảnh không đổi có giá trị 1 ở mọi nơi:

  • bộ lọc bên trái sẽ xuất ra một hình ảnh không đổi với giá trị 16 ở mọi nơi,
  • cái thứ hai (ngoài cùng bên phải) tạo ra một hình ảnh không đổi có giá trị 1.

Từ ví dụ đơn giản này, bạn có thể thấy rằng một bộ lọc đã bảo toàn được hình ảnh của hình ảnh, trong khi bộ lọc thứ hai tăng nó.

Trong khi nó vô hại trong trường hợp này , nó có thể dẫn đến nhiều vấn đề trong thực tế . Ví dụ: thuật toán lặp có thể phân kỳ (do tràn số ), máy tính của bạn có thể hết bit để thể hiện dữ liệu của bạn hoặc bạn có thể mất độ chính xác (giá trị dấu phẩy động chính xác đơn và kép không có độ chính xác thống nhất trong phạm vi các giá trị có thể).


Bạn có thể vui lòng giải thích về "phạm vi động" mà bạn đã đề cập trong dòng đầu tiên của mình không?
Animesh Pandey

Tôi đã chỉnh sửa câu trả lời. Xin vui lòng hỏi thêm thông tin.
sansuiso

1

Khi bạn kết hợp hình ảnh với bộ lọc, kết quả phụ thuộc vào cả giá trị pixel của bộ lọc và pixel. nếu bộ lọc không tổng hợp thành một, thì nó sẽ có đóng góp tích cực của riêng nó cho tích chập. Ví dụ: nếu bạn tạo một hình ảnh chỉ bao gồm một giá trị không đổi, với bộ lọc không tổng hợp thành một, thì tích chập sẽ dẫn đến một hình ảnh có giá trị không đổi cao hơn. Vì vậy, bộ lọc này sẽ thay đổi độ sáng trung bình của hình ảnh, điều này có thể không được mong muốn.

Sự khác biệt chính xác giữa cả hai hình ảnh sẽ là một thuật ngữ không đổi, tức là tổng của hạt nhân bộ lọc, phạm vi động là sự khác biệt giữa các giá trị dương và âm, sẽ giữ nguyên chính xác.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.