Sự khác biệt thực tế có liên quan giữa các phương pháp lấy mẫu hình ảnh khác nhau là gì?


22

Mathematica của ImageResizechức năng hỗ trợ nhiều resampling phương pháp.

Không quen thuộc với khu vực này, ngoài hàng xóm gần nhất, song tuyến, biquadratic và bicubic (rõ ràng từ tên), tôi bị lạc.

Bạn có thể chỉ cho tôi một số nguồn sẽ giải thích sự khác biệt cơ bản (toán học) giữa các phương pháp này và đặc biệt chỉ ra sự khác biệt thực tế (ví dụ: bằng cách hiển thị hình ảnh mẫu trong đó sự lựa chọn phương pháp thực sự quan trọng và đưa ra sự khác biệt đáng chú ý)?

Tôi không có nền tảng xử lý tín hiệu, vì vậy tôi thích phần giới thiệu "nhẹ nhàng" và súc tích :-)


Tôi sẽ sao chép ở đây danh sách các ImageResizephương pháp cho những người "lười biếng" nhấp vào liên kết:

  • "Gần nhất" định hình lại hàng xóm gần nhất

  • Nội suy song tuyến "song phương"

  • Nội suy spline "Biquadratic"

  • Nội suy spline "bicubic"

  • "Gaussian" tái định hình Gaussian

  • Phương pháp nội suy đa biến "Lanczos" Lanczos

  • Nội suy cosin "cosine"

  • Nội suy Hamming "Hamming" nâng cao

  • "Hann" nội suy nâng cao Hann

  • "Blackman" cosin nâng cao ba nhiệm kỳ

  • Nội suy cửa sổ hình tam giác "Bartlett"

  • "Kết nối" nội suy Welch bình phương

  • "Welch" Nội suy bậc hai Welch

  • Nội suy khối "Parzen" piecewise

  • Nội suy Bessel được sửa đổi theo thứ tự "Kaiser"


1
Câu hỏi có vẻ quá rộng đối với tôi. Sẽ là ý tưởng tốt khi tách nó thành các phương pháp cụ thể và đặt câu hỏi cụ thể cho các phương pháp mà bạn gặp vấn đề.
mirror2image

Hơi tiếp tuyến với câu hỏi của bạn, bạn có thể thấy hình ảnh này upsampling so sánh thú vị: general-cathexis.com/interpolation/index.html
Mr.Wizard

Tôi sẽ chú ý rằng tất cả các phương pháp bạn đã viết là Bất biến không gian. Tôi nghĩ rằng các phương pháp hiện đại hơn cho việc lấy mẫu là Edge Aware và Space Variant cũng vậy.
Royi

Đây là biến đổi áp chót. Nó được gọi là biến đổi PB và nó biến đổi hình ảnh bằng cách dự đoán các giá trị theo chu kỳ theo xác suất xảy ra sau khi được huấn luyện trên nhiều hình ảnh khác. Đây là những gì [kết quả] [1] trông như thế nào. [1]: v1.std3.ru/57/a9/ Ấn
MyBushisaNeonJungle

Câu trả lời:


12

I(m,n)m,nm,n

I~(m,n)=m=mw+1m+w n=nw+1n+wI(m,n) f(mm,nn)

I~I(x,y)

f(m,n)

Cũng giống như với các chức năng của cửa sổ đối với các tín hiệu thời gian, thật dễ dàng để có được ý chính về những gì một hạt nhân nội suy hình ảnh thực hiện bằng cách nhìn vào đáp ứng tần số của nó. Từ câu trả lời của tôi về các chức năng của cửa sổ :

Hai yếu tố chính mô tả chức năng của cửa sổ là:

  1. Chiều rộng của thùy chính (nghĩa là ở mức tần số nào thì một nửa công suất của đáp ứng tối đa)
  2. Sự suy giảm của các thùy bên (nghĩa là các thùy bên cách xa phần chính bao xa). Điều này cho bạn biết về rò rỉ quang phổ trong cửa sổ.

Điều này khá đúng với các hạt nhân nội suy. Sự lựa chọn về cơ bản là sự đánh đổi giữa lọc tần số (suy giảm của sidelobes), nội địa hóa không gian (chiều rộng của mainlobe) và giảm các hiệu ứng khác như đổ chuông (hiệu ứng Gibbs), khử răng cưa, làm mờ, v.v. Ví dụ, một hạt nhân có dao động như vậy vì hạt nhân chân thành và hạt nhân Lanczos4 sẽ giới thiệu "đổ chuông" trong hình ảnh, trong khi đó, một mô hình Gaussian sẽ không giới thiệu tiếng chuông.

Đây là một ví dụ đơn giản hóa trong Mathicala cho phép bạn thấy tác dụng của các hàm nội suy khác nhau:

true = ExampleData[{"TestImage", "Lena"}];
resampling = {"Nearest", "Bilinear", "Biquadratic", "Bicubic", 
   "Gaussian", "Lanczos", "Cosine", "Hamming", "Hann", "Blackman", 
   "Bartlett", "Connes", "Welch", "Parzen", "Kaiser"};
small = ImageResize[true, Scaled[1/4]];

trueI(x,y)smallI(m,n)I(m,n)I~(m,n)

nhập mô tả hình ảnh ở đây nhập mô tả hình ảnh ở đây

Bạn có thể thấy rằng các hàm nội suy khác nhau có hiệu ứng khác nhau. Gần nhất và một vài thứ khác có các tính năng rất thô và về cơ bản bạn có thể thấy các đường răng cưa (xem hình ảnh có kích thước đầy đủ, không phải màn hình lưới). Bicubic, biquadratic và Parzen khắc phục điều này nhưng giới thiệu rất nhiều mờ. Trong tất cả các hạt nhân, Lanczos dường như (trực quan) là hấp dẫn nhất và là một trong những công việc tốt nhất trong số rất nhiều.

Tôi sẽ cố gắng mở rộng dựa trên câu trả lời này và cung cấp các ví dụ trực quan hơn thể hiện sự khác biệt khi tôi có thời gian. Bạn có thể muốn đọc bài viết khá dễ dàng và nhiều thông tin này mà tôi tìm thấy trên web (cảnh báo PDF).


Là ký hiệu infix mà tôi thấy!?! : ->
Mr.Wizard

@ Mr.Wizard Tôi đã nói rằng tôi sẽ thực hiện một nỗ lực trung thực :)
Lorem Ipsum
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.