Upampling song phương là gì?


9

Tôi đã làm việc với các thuật toán nội suy khác nhau bao gồm các phép nội suy tuyến tính, khối (và song tuyến và nhị phân), các phép nội suy khác (và Nurbs, v.v.), nội suy trễ và một số thuật toán khác, nhưng tôi không thể tìm thấy bất kỳ thông tin cơ bản nào giải thích upampling song phương là gì.

Tôi đã có thể tìm thấy thông tin về Ghép đôi song phương , tốt nhất có thể để tôi nội suy song song nhiều phần dữ liệu, sử dụng các gợi ý từ mỗi phần để giúp nội suy khác tốt hơn, nhưng gặp khó khăn trong việc tách thông tin của BU và JBU.

Có ai có thể giải thích những ý tưởng cơ bản về những gì upampling song phương là về?


1
Bài viết gốc về lọc song phương, "Lọc song phương cho hình ảnh màu xám và màu" , của Tomasi và Manduchi: users.cs.duke.edu/~tomasi/ con / tomasi / tomasiIccv98.pdf
Julien Guertault

Câu trả lời:


9

Có vẻ như bạn đang hỏi hai điều. Tôi thực sự không thể nói về mặt kỹ thuật về JBU, nhưng tôi có thể đưa ra một cái nhìn tổng quan về các khái niệm cần thiết và lọc song phương nói chung. Có lẽ bạn sẽ cần phải tìm thêm chi tiết cho mình, nhưng điều này sẽ tạo ra một cấu trúc mạch lạc để bắt đầu từ đó.


Sửa "hình ảnh"

Nhiều người xử lý hình ảnh xem việc lọc như là một cái gì đó được thực hiện như là một quá trình hậu kỳ, hoặc là một cách để thu nhỏ hình ảnh. Quan điểm của nhà toán học là chính xác hơn, mô tả và phức tạp.

Khi bạn có tệp hình ảnh, bạn không có hình ảnh thực. Bạn có "giá trị" pixel, chỉ có giá trị ở trung tâm của pixel. Nói một cách đơn giản, mỗi pixel có một khu vực có màu đó. Về mặt toán học, những gì bạn đang làm là sử dụng bộ lọc tái tạo lân cận gần nhất để tái tạo hình ảnh thật từ các giá trị pixel. Vì vậy, một "hình ảnh" thực sự là một tập hợp các mẫu và bộ lọc tái tạo, điển hình là hàng xóm gần nhất .

Lấy mẫu lại

Khi bạn nâng cấp hình ảnh, những gì bạn thực sự đang làm là lấy mẫu lại . Làm thế nào để bạn làm điều này? Bạn lấy tín hiệu của mình và tạo một bộ mẫu mới từ nó. Nhưng đối với một hình ảnh, tôi chỉ nói rằng chúng ta không hình ảnh thực sự; chúng ta phải xây dựng lại nó trước. Vì vậy, một quy trình lấy mẫu điển hình trông như thế này:

  1. Lấy giá trị pixel của bạn.
  2. Tái tạo hình ảnh giữa các giá trị, sống ở trung tâm pixel, bằng cách sử dụng bộ lọc tái tạo.
  3. Đo một bộ mẫu mới từ hình ảnh được dựng lại, có thể cách nhau một cách khác nhau.
  4. Vứt bỏ các mẫu cũ và sử dụng những mẫu mới.

Điểm mấu chốt là bộ lọc tái tạo được sử dụng là "bộ lọc" được sử dụng để lấy mẫu lại. Ví dụ: "mẫu vật lưỡng tính" sẽ sử dụng bộ lọc tái cấu trúc nhị phân.

Nó chỉ ra rằng nếu bạn sử dụng một chức năng chân thành cho bộ lọc tái tạo và bạn không thu nhỏ hình ảnh, về mặt lý thuyết, bạn sẽ nhận được cùng một hình ảnh. Trong thực tế, nếu bạn nâng cấp hình ảnh và sau đó hạ thấp nó một lần nữa, bạn sẽ nhận được câu trả lời tương tự. Điều này thường không đúng với bất kỳ bộ lọc nào khác.

Hầu hết các bộ lọc xấp xỉ một bộ lọc chân thành ở mức độ nhiều hơn hoặc ít hơn. Sự sai lệch dẫn đến mất hình ảnh.

Lọc

Nếu bạn sử dụng cùng tỷ lệ trước / sau khi lấy mẫu, bạn sẽ thực hiện một việc gọi là "lọc". Chính thức, lọc được lấy mẫu lại mà không thay đổi tỷ lệ mẫu. Lọc là một trường hợp đặc biệt của việc lấy mẫu lại.

Mục đích duy nhất có thể là lọc nó để loại bỏ thông tin (ví dụ: Gaussian) hoặc cũng có thể để bóp méo hoặc thêm thông tin giả (ví dụ: Sobel).

Lọc song phương

Bạn có thể sử dụng nhiều bộ lọc khác nhau để lọc. Lọc song phương là một trong số đó. Tôi không tin rằng nó được coi là tối tân cho bất kỳ mục đích nào bây giờ (mặc dù tôi không biết nó là gì; có lẽ là một số điều học máy mới lạ mà tôi mong đợi).

Bộ lọc song phương là bộ lọc phi tuyến tính, có nghĩa là nó không có đại diện Fourier đẹp. Về mặt khái niệm, nó giống như một Gaussian, nhưng chính màu sắc nguồn cũng ảnh hưởng đến "khoảng cách" của pixel so với các pixel khác. Điều này có xu hướng làm mịn các khu vực bằng phẳng trong khi bảo quản các cạnh.

Nâng cấp song phương

Đến bây giờ, tôi hy vọng bạn sẽ thấy tôi đang đi đâu với điều này: bất kỳ bộ lọc nào bạn có thể sử dụng để lọc, bạn có thể sử dụng để nâng cấp hoặc thu nhỏ, đây thực sự là một điều tương tự (vì tất cả đều là mô hình lại).

Nếu bạn đã triển khai bộ lọc song phương, bạn sẽ có thể thực hiện đơn giản hơn bộ cộng hưởng bộ lọc song phương - giống như, nếu bạn đã triển khai bộ lọc Gaussian, bạn sẽ có thể triển khai bộ lọc bộ lọc Gaussian.

Khó khăn duy nhất có thể là các định nghĩa. Thật không may, sự khác biệt giữa lọc và lấy mẫu lại bị nhầm lẫn một cách có hệ thống với sự không tồn tại thường xuyên trong tài liệu xử lý hình ảnh. Để thực hiện bộ lọc loại song phương, tôi sẽ phụ thuộc rất nhiều vào sự tương đồng của nó với việc tái định hình Gaussian. IIRC (Tôi đã không đọc báo trong nhiều năm) lọc song phương được đặt theo khía cạnh pixel, không phải mẫu.


Làm thế nào lọc song phương hoạt động cụ thể là những gì tôi đang cố gắng để có được thông tin về. bạn có thể giải thích về điều đó không?
Alan Wolfe

Người ta có thể mượn hình ảnh cho những giải thích ở phần đầu từ đây
joojaa

@AlanWolfe Tôi giả sử bạn đã hỏi sau bối cảnh rộng hơn, vì việc triển khai bộ lọc song phương cơ bản có khả năng cao của Google và khá đơn giản. Như tôi đã viết, ý tưởng cơ bản là biến yếu tố giá trị thành trọng số chứ không chỉ là khoảng cách.
imallett

Ngoài ra câu trả lời của @ joolaa khá hay và có thể hữu ích như một lời giải thích thứ hai về tổng quan của tôi.
imallett

1
Bây giờ tôi có thuật ngữ "bộ lọc song phương", tôi gặp nhiều may mắn hơn trên Google. Cảm ơn vì điều đó.
Alan Wolfe

3

Điều này có lẽ không khám phá hết chiều sâu của thuật ngữ, nhưng điều đầu tiên xuất hiện trong đầu tôi khi tôi nghe "sự đảo lộn song phương" là sự pha trộn nhận thức sâu sắc của hình ảnh có độ phân giải thấp lên hình ảnh có độ phân giải cao; chẳng hạn, khi bạn kết xuất hình học pha trộn alpha vào bộ đệm có độ phân giải một nửa (để tiết kiệm hiệu suất) và sau đó kết hợp lại vào mục tiêu kết xuất chính. Angelo Pesce đã viết một bài giải thích nó tốt.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.