DCT và ngưỡng cứng


8

Nếu tôi có một Hình ảnh và tôi tìm thấy DCT và sau đó áp dụng ngưỡng mạnh trên các hệ số và sau đó IDCT thì tôi đã giảm nhiễu. Ai đó có thể vui lòng giải thích chi tiết hoặc chỉ cho tôi câu trả lời là tại sao điều này hoạt động. Tôi hiểu tại sao bộ lọc chặn tần số cao sẽ hoạt động trong việc khử nhiễu (vì chúng tôi cho rằng nhiễu bao gồm các thành phần tần số cao) nhưng tại sao cường độ ngưỡng hoạt động?

Câu trả lời:


4

Lọc thông thấp dựa trên giả định rằng hình ảnh "tự nhiên" có nhiều năng lượng hơn trong các hệ số tần số thấp so với hệ số tần số cao; trong khi tiếng ồn sẽ ảnh hưởng như nhau tất cả các hệ số. Do đó, việc loại bỏ các hệ số tần số cao sẽ loại bỏ nhiễu tương đối nhiều hơn tín hiệu. Vấn đề là có các hệ số tần số cao "hợp pháp" trong hình ảnh, chẳng hạn như các cạnh. Khử nhiễu bằng cách lọc thông thấp sẽ làm giảm các hệ số đó và gây mờ cạnh.

Thuộc tính được sử dụng trong ngưỡng cường độ là độ thưa thớt - hình ảnh "tự nhiên" rất có thể chỉ có một tập hợp nhỏ các hệ số khác không cao trong miền tần số. Thêm nhiễu đồng nhất (và độc lập từ pixel sang pixel) tương đương với việc thêm một giá trị ngẫu nhiên nhỏ cho tất cả các hệ số tần số. Kết quả là tất cả các hệ số 0 trong ảnh gốc hiện có một giá trị nhỏ; trong khi các hệ số cao trong ảnh gốc thì tương đối không bị ảnh hưởng. Việc phá vỡ các hệ số cường độ nhỏ sẽ hủy bỏ sự đóng góp của nhiễu lên các hệ số đó - mặc dù nó sẽ không phục hồi ảnh hưởng của nhiễu đối với các hệ số cao.

Nếu bạn thay thế các cạnh bằng quá độ / tấn công, điều tương tự cũng được áp dụng cho âm thanh.


1

Hãy xem xét vấn đề tối ưu hóa sau:

argminx12Axy+λx0

Trường hợp đang đếm số phần tử khác không.0

Được biết, có thể sử dụng Ngưỡng cứng lặp để giải quyết vấn đề này và trong một số trường hợp được đảm bảo để tìm ra giải pháp chính xác (Xem Ngưỡng cứng lặp cho cảm biến nén ).

Bây giờ, nếu bạn sử dụng làm Từ điển DCT (mà bạn có thể và nhiều người làm) thì về cơ bản những gì bạn làm là cố gắng giải quyết điều này.A

Đây là quan điểm tối ưu hóa.
Lý do tại sao nó hoạt động tốt như vậy, ý tưởng về các đại diện thưa thớt (Mức độ tự do thấp)?
Vâng, trực giác đơn giản là hiệu quả.
Mọi thứ nên đơn giản khi người ta sử dụng các công cụ phù hợp để mô tả chúng.

Nơi tuyệt vời để có cái nhìn sâu sắc là eDx - Các đại diện thưa thớt trong xử lý tín hiệu và hình ảnh: Nguyên tắc cơ bản của Michael Elad .


0

DCT rất hữu ích trong việc nén năng lượng, vì vậy chỉ cần đặt sau khi DCT của hình ảnh được phân giải thành trọng số của một số chức năng cơ bản. Sau một DCT, ma trận kết quả sẽ chứa các bội số cho mỗi hàm cơ sở. Và người ta có thể không mất tính tổng quát nói rằng các hệ số có giá trị cao là những yếu tố đóng góp đáng kể vào nhận thức tâm lý thị giác của hình ảnh bằng mắt người.

Nhiễu tần số thấp sẽ thêm vào các hệ số tần số thấp, tuy nhiên nhiễu tần số cao sẽ dẫn đến cường độ nhỏ hơn của các hệ số tần số cao của ma trận biến đổi.

Vì vậy, khi chúng ta vượt ngưỡng ma trận biến đổi, chúng ta loại bỏ tất cả nhiễu không phải là một phần của hệ số cường độ cao. Vì vậy, một số tiếng ồn sẽ vẫn hiện diện có thể rõ ràng sau IDCT.

Nhưng ý tưởng chính ở đây là trong các hình ảnh trong đó dữ liệu tần số cao là tối thiểu, một DCT, theo sau là ngưỡng cường độ có thể sẽ làm tốt hơn Bộ lọc thông cao thông thường. Nếu người ta có thể tưởng tượng một hình ảnh trong đó bất kỳ tần số nào trong hình ảnh đều có thành phần hình ảnh thực và thành phần nhiễu, trong đó thành phần hình ảnh thực tế nhỏ hoặc bằng 0, DCT theo sau là cường độ sẽ loại bỏ thành phần tần số đó, do đó chủ yếu nhắm vào thành phần nhiễu .

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.