Tại sao các bộ lọc Gaussian được sử dụng làm bộ lọc thông thấp trong xử lý hình ảnh?


30

Trong xử lý tín hiệu 1d, nhiều loại bộ lọc thông thấp được sử dụng. Mặc dù vậy, các bộ lọc Gaussian hầu như không bao giờ được sử dụng.

Tại sao chúng rất phổ biến trong các ứng dụng xử lý ảnh? Các bộ lọc này có phải là kết quả của việc tối ưu hóa bất kỳ tiêu chí nào không hay chỉ là giải pháp đặc biệt vì hình ảnh 'băng thông' thường không được xác định rõ.

Câu trả lời:


28

Các ứng dụng xử lý hình ảnh khác với các ứng dụng xử lý âm thanh, bởi vì nhiều trong số chúng được điều chỉnh cho mắt. Mặt nạ Gaussian mô phỏng gần như hoàn hảo độ mờ quang học (xem thêm các chức năng trải rộng điểm ). Trong bất kỳ ứng dụng xử lý ảnh nào được định hướng theo sản xuất nghệ thuật, các bộ lọc Gaussian được sử dụng để làm mờ theo mặc định.

Một thuộc tính định lượng quan trọng khác của các bộ lọc Gaussian là chúng ở mọi nơi không âm . Điều này rất quan trọng vì hầu hết các tín hiệu 1D khác nhau khoảng 0 ( ) và có thể có giá trị dương hoặc âm. Hình ảnh khác nhau theo nghĩa là tất cả các giá trị của hình ảnh đều không âm ( x R + ). Kết hợp với hạt nhân Gaussian (bộ lọc) đảm bảo kết quả không âm, do đó, hàm này ánh xạ các giá trị không âm sang các giá trị không âm khác ( f : R +R + ). Do đó, kết quả luôn là một hình ảnh hợp lệ khác.xRxR+f:R+R+

Nói chung, việc loại bỏ tần số trong xử lý hình ảnh không quan trọng bằng tín hiệu 1D. Ví dụ: trong các sơ đồ điều chế, các bộ lọc của bạn cần phải rất chính xác để từ chối các kênh khác được truyền trên các tần số sóng mang khác nhau, v.v. Tôi không thể nghĩ bất cứ điều gì giống như hạn chế cho các vấn đề xử lý hình ảnh.


21

Các bộ lọc Gaussian được sử dụng trong xử lý ảnh vì chúng có một thuộc tính mà sự hỗ trợ của chúng trong miền thời gian, bằng với hỗ trợ của chúng trong miền tần số. Điều này xuất phát từ Gaussian là Fourier Transform của chính nó.

ý nghĩa của điều này là gì? Chà, nếu sự hỗ trợ của bộ lọc giống nhau ở cả hai miền, điều đó có nghĩa là tỷ lệ của cả hai hỗ trợ là 1. Khi nó bật ra, điều này có nghĩa là bộ lọc Gaussian có 'sản phẩm băng thông thời gian tối thiểu'.

Vì vậy, những gì bạn có thể nói? Vâng, trong xử lý hình ảnh, một nhiệm vụ rất quan trọng là loại bỏ nhiễu trắng, trong khi vẫn duy trì các cạnh nổi bật. Đây có thể là một nhiệm vụ mâu thuẫn - nhiễu trắng tồn tại ở tất cả các tần số như nhau, trong khi các cạnh tồn tại trong dải tần số cao. (Thay đổi đột ngột các tín hiệu không gian). Trong loại bỏ nhiễu truyền thống thông qua lọc, tín hiệu được lọc thấp, có nghĩa là các thành phần tần số cao trong tín hiệu của bạn bị loại bỏ hoàn toàn.

Nhưng nếu hình ảnh có các cạnh là các thành phần tần số cao, LPF'ing truyền thống cũng sẽ loại bỏ chúng và trực quan, điều này thể hiện khi các cạnh trở nên 'nhòe' hơn.

Làm thế nào sau đó, để loại bỏ tiếng ồn, nhưng cũng bảo tồn các cạnh tần số cao? Nhập hạt nhân Gaussian. Do Biến đổi Fourier của Gaussian cũng là Gaussian, bộ lọc Gaussian không có ngưỡng cắt mạnh ở một số tần số băng thông vượt qua mà tất cả các tần số cao hơn được loại bỏ. Thay vào đó, nó có một cái đuôi duyên dáng và tự nhiên trở nên thấp hơn bao giờ hết khi tần số tăng. Điều này có nghĩa là nó sẽ hoạt động như một bộ lọc thông thấp, nhưng cũng cho phép các thành phần tần số cao hơn tương xứng với tốc độ phân rã của đuôi. (Mặt khác, LPF sẽ có sản phẩm băng thông thời gian cao hơn, bởi vì sự hỗ trợ của nó trong miền F không lớn bằng Gaussian ').

Điều này sau đó cho phép một người đạt được điều tốt nhất của cả hai thế giới - loại bỏ tiếng ồn, cộng với bảo toàn cạnh.


2
Tôi không chắc chắn rằng bạn có thể so sánh trực tiếp hai hỗ trợ vì một hỗ trợ được đo bằng thời gian / chiều dài và hỗ trợ còn lại tính bằng Hz / radian. Hình thái của chúng là giống hệt nhau, nhưng tài sản quy mô phổ quát vẫn giữ.
Phonon

Cảm ơn đã nhắc nhở tôi về sản phẩm băng thông thời gian tối thiểu. Tuy nhiên, như Phonon đã đề cập, việc giảm hỗ trợ miền không gian (~ thời gian) nhất thiết phải tăng băng thông. Không có cách nào bạn có thể có cả khử nhiễu và bảo toàn các cạnh bằng bộ lọc Gaussian đơn giản. Đó là lý do tại sao Perona & Malik đã phát triển bộ lọc bất đẳng hướng.
nimrodm

@Phonon Như tôi đã thấy, các hỗ trợ chỉ đơn giản là có bao nhiêu mục nhập khác không mô tả chức năng trong một trong hai miền - Tôi tin rằng chúng giống nhau. (Do đó, tỷ lệ 1). Người ta nói, sản phẩm băng thông thời gian được đo là một sản phẩm có phương sai của hàm theo thời gian và tần số. Làm thế nào bình thường hóa của nó khác với các tác giả, tôi đã thấy nó tương đương với 1/2 hoặc 1/4.
Spacey

1
@nimrodm "giảm hỗ trợ miền không gian (~ thời gian) nhất thiết phải tăng băng thông.", Vâng, đó là xu hướng , xuất phát từ mối quan hệ nghịch đảo tần số thời gian. (Đây là nơi không chắc chắn tần số thời gian đến từ). Tuy nhiên, hàm Gaussian thuộc một lớp hoàn toàn tối thiểu hóa sản phẩm này. Với mối quan hệ nghịch đảo giữa thời gian và tần suất, không có cách nào để làm như vậy trừ khi nó có sự hỗ trợ như nhau trong cả hai miền.
Spacey

@nimrodm Trong khuếch tán dị hướng, các hạt nhân tôi đã thấy vẫn là gaussian, mặc dù với các ma trận hiệp phương sai phụ thuộc vào độ dốc của hình ảnh. (Đây cũng là một phương pháp phi tuyến tính, làm mịn gaussian VS tuyến tính). Nhưng, gaussian vẫn được sử dụng do các thuộc tính của nó.
Spacey

11

Bạn đã có câu trả lời tốt, nhưng tôi sẽ chỉ thêm một thuộc tính hữu ích nữa của các bộ lọc 2D Gaussian, đó là chúng có thể tách rời , tức là bộ lọc 2D có thể được phân tách thành hai bộ lọc 1D. Đây có thể là một xem xét hiệu suất quan trọng đối với kích thước hạt nhân lớn hơn, vì bộ lọc tách rời MxN có thể được thực hiện bằng M+Nphép cộng nhiều lần trong khi bộ lọc MxN không thể tách rời đòi hỏi phải cộng M*Nnhiều lần.


2
Đó là một lý lẽ tốt. Bộ lọc 2D Gaussian vừa đối xứng hoàn toàn vẫn có thể tách rời nên độ phức tạp thực hiện giảm đáng kể.
nimrodm

1
Là một tài liệu tham khảo, Hướng dẫn của nhà khoa học và kỹ sư về DSP cung cấp một mô tả tuyệt vời về tính chất này trong Chương 24 .
Caleb Reister

6

Hướng dẫn về hình ảnh có một lời giải thích tuyệt vời về lý do tại sao việc lọc bằng các hàm chân thực dẫn đến hiệu ứng "đổ chuông" trong khi gaussian thì không. ( http://www.imagemagick.org/Usage/fourier/#blurringhttp://www.imagemagick.org/Usage/fourier/#circle_spectrum ). Khi bạn có các cạnh (không liên tục) trong hình ảnh của mình (điều mà hầu hết các hình ảnh làm được) thì việc loại bỏ hoàn toàn tất cả các tần số cao sẽ khiến bạn bị gợn sóng trong miền không gian. Bạn cũng có thể đổ chuông khi bạn lọc sóng vuông với chức năng chân thành trong một chiều.


2

Đã có những câu trả lời hay rồi, nhưng tôi sẽ thêm hạt muối của mình, thay vào đó là một góc nhìn khác:

Lọc ở mức trừu tượng nhất có thể được coi là áp dụng một số kiến ​​thức trước cho một số dữ liệu thô. Điều đó có nghĩa là việc áp dụng một số thuật toán lọc là áp dụng điều này trước khi tìm ra tín hiệu tối ưu cho tỷ lệ nhiễu.

Đối với hình ảnh, ưu tiên cổ điển là độ mịn của các giá trị (ví dụ cường độ) đối với vị trí (điều này có thể được xem là chức năng trải rộng điểm được đề cập bởi @Phonon). Nó thường được mô hình hóa như một gaussian vì nó là hình dạng mà bạn sẽ có được khi trộn các đối tượng khác nhau với bán kính độ mịn đã biết (đây được gọi là định lý giới hạn trung tâm ). Điều này chủ yếu hữu ích khi bạn muốn tạo dẫn xuất của hình ảnh: thay vì phân biệt tín hiệu thô (sẽ tạo ra đầu ra nhiễu), bạn nên làm điều đó trên hình ảnh được làm mịn. Điều này tương đương với việc áp dụng toán tử giống như wavelet như bộ lọc Gabor .

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.