Toán học đằng sau đặc tính giảm nhiễu của bộ lọc trung vị là gì?


8

Tôi quan tâm đến việc tìm hiểu lý do toán học tại sao việc áp dụng bộ lọc trung vị trên hình ảnh (hoặc tín hiệu) dẫn đến giảm nhiễu.


Hiệu quả của bộ lọc trung vị sẽ phụ thuộc vào loại tiếng ồn. Nhiễu có giá trị trung bình bằng 0, ví dụ nhiễu Gaussian trắng phụ gia (AWGN) sẽ được loại bỏ khá tốt khi có đủ mẫu. Nếu tiếng ồn là một dạng nhiễu khác (phai đa đường), bộ lọc trung vị sẽ không thực sự hữu ích.
Nick T

Câu trả lời:


13

Trực giác: Trực giác là thế này: Tiếng ồn của bạn là một số sự kiện hoặc sự kiện rất hiếm, và khi so sánh với các sự kiện khác, trông giống như các ngoại lệ không thực sự ở đó.

Ví dụ: nếu bạn đang đo tốc độ của mọi chiếc xe trên đường cao tốc khi chúng đi ngang qua bạn và vẽ đồ thị cho chúng, bạn sẽ thấy rằng chúng thường nằm trong phạm vi từ mph đến mph. Tuy nhiên, khi bạn đang kiểm tra dữ liệu của mình cho sếp, bạn sẽ thấy rằng bạn đã ghi lại tốc độ dặm / giờ. Giá trị này không chỉ không có ý nghĩa vật lý đối với tốc độ của một chiếc xe thực tế trên đường cao tốc, mà còn vượt ra khỏi dữ liệu còn lại của bạn. Phấn đấu sự kiện này lên đến một số lỗi đo lường lạ, bạn loại bỏ nó và đưa phần còn lại của dữ liệu cho sếp của bạn.50701,000,000

Tuy nhiên, khi bạn tiếp tục các phép đo của mình ngày này qua ngày khác, bạn nhận thấy rằng cứ thỉnh thoảng, bạn lại có được những phép đo tốc độ hoang dã đó. Ví dụ: trong khoảng thời gian 1 giờ, bạn đo 1000 chiếc ô tô và tốc độ của chúng rất tốt trong khoảng từ đến dặm / giờ, tuy nhiên 3 trong số đó có tốc độ dặm / giờ, dặm / giờ và dặm / giờ, phá vỡ không chỉ luật pháp địa phương, mà còn những người của vật lý lý thuyết.507023,42412,000,121192,212,121,329,982,321,912

Bạn cảm thấy mệt mỏi vì phải liên tục đi vào và loại bỏ những điểm dữ liệu sai lầm đó do radar giá rẻ gây ra bằng tay. Sau tất cả, ông chủ của bạn thực sự chỉ quan tâm đến số liệu thống kê về tốc độ, không quá nhiều mỗi giá trị thực tế. Anh ấy thích làm biểu đồ đẹp cho ông chủ của mình .

Những kẻ sai lầm và số lượng lớn đó là một loại 'tiếng ồn' mà bạn nghĩ - 'tiếng ồn' gây ra bởi radar giá rẻ mà bạn đã mua từ một cửa hàng cầm đồ râm mát. Là tiếng ồn gaussian phụ gia tiếng ồn? (AWGN). Có và không - Phổ của nó là băng rộng và trắng, nhưng nó rất hiếm, tạm thời và rất cục bộ. Nó được gọi tốt hơn là nhiễu 'muối và hạt tiêu', (đặc biệt là trong lĩnh vực xử lý hình ảnh).

Do đó, những gì bạn có thể làm là chạy dữ liệu của bạn thông qua bộ lọc trung bình . Bộ lọc trung vị của bạn sẽ lấy một khối nói, điểm tốc độ, (điểm 1 đến 5), tìm trung vị và nhổ giá trị đó làm tốc độ 'trung bình'. Sau đó, nó sẽ lấy 5 điểm tiếp theo, (điểm 2 đến 6), lấy trung vị đó và nhổ cái này làm trung bình, v.v.5

Điều gì xảy ra khi bạn bắt gặp một trong những tốc độ nhanh hơn ánh sáng của bạn?. Hãy để chúng tôi nói rằng 5 tốc độ của bạn là [45, 65, 50, 999999, 75]. Nếu bạn lấy mức trung bình bình thường, tốc độ 'trung bình' của bạn ở đây sẽ là một thứ khá lớn. Tuy nhiên, nếu bạn lấy trung vị, 'trung bình' của bạn sẽ là 65. Giá trị nào gần đúng nhất với mức trung bình mà bạn thực sự đang cố gắng đo? Các số liệu trung vị.

Do đó, nếu bạn lọc dữ liệu của mình bằng bộ lọc trung vị, bạn chắc chắn sẽ xóa các ngoại lệ đó - và do đó bạn đã trung thành 'khử nhiễu' tín hiệu của mình. Ngược lại, nếu bạn đã cố gắng loại bỏ tiếng ồn của mình thông qua bộ lọc truyền thống, (không có gì ngoài tổng trọng số chuyển động), thay vào đó, bạn sẽ 'bôi' lỗi trên dữ liệu của mình và không loại bỏ nó.

Toán học: Toán học là thế này: Phép đo trung bình là những gì được gọi là thống kê đơn hàng . Đó là, nó trả về giá trị của dữ liệu của bạn, dọc theo một số điểm, sau khi nó đã được đặt hàng. Tối đa và tối thiểu cũng là số liệu thống kê đơn hàng - chúng trả về các điểm cực trị của dữ liệu của bạn sau khi được đặt hàng. Lấy trung vị cũng trả về giá trị của dữ liệu được đặt hàng của bạn, nhưng ngay từ giữa.

Nhưng tại sao chúng khác với các bộ lọc trung bình? Chà, bộ lọc trung bình tính toán trung bình bằng cách sử dụng tất cả dữ liệu. Nếu bạn nhận thấy từ max, min và median, bạn sẽ nhận được câu trả lời mà không cần sử dụng tất cả dữ liệu. Trong thực tế, tất cả các trung vị làm là sắp xếp dữ liệu của bạn và chọn giá trị ở giữa. Nó không bao giờ 'chạm' vào các ngoại lệ, giống như những tốc độ lớn mà bạn đo được.

Đây là lý do tại sao trung vị - một thống kê đơn hàng - có thể 'loại bỏ' tiếng ồn ngoại lệ cho bạn. Tiếng ồn bên ngoài phân tách chính nó ở phía trước trung vị, và trung vị không bao giờ đến gần nó hoặc xem xét nó, trong khi vẫn cung cấp cho bạn một ước tính tốt về xu hướng trung tâm.


6

Giả sử các biến ngẫu nhiên độc lập với phân phối bình thường, xác suất giá trị sẽ vượt quá, giả sử, 2 độ lệch chuẩn sẽ là khoảng 0,01.

Nếu bạn có bộ lọc trung bình có chiều rộng 3, bộ ba đó phải chứa hai ngoại lệ trên cùng một phía của giá trị trung bình để có một ngoại lệ đi qua. Sự kiện này có xác suất 0,00005.20.0052=

Khi bộ lọc trung vị tăng theo chiều rộng, xác suất xuất hiện của nó sẽ giảm theo cấp số nhân.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.