Lanczos tái định hình có ích gì trong bối cảnh không gian?


46

GDAL bao gồm một phương pháp lấy mẫu lại ngoài sự pha trộn thông thường của hàng xóm gần nhất, song tuyến tính, khối và splines: "Lanczos windowed resampling". Tôi hiểu rằng đó là bộ lọc tích chập, nhưng không giống như các hình ảnh có kết quả chủ quan, việc lấy mẫu lại được sử dụng cho dữ liệu không gian có ý nghĩa khác. Lanczos là gì và việc sử dụng nó ảnh hưởng đến đầu ra như thế nào?


4
Đây là bản sao chính xác của stackoverflow.com/questions/1854146/ trên đó có một câu trả lời hay.
whuber

Phần 4 của một bài báo năm 1979 của Claude Duchon có thể hữu ích.
whuber

Câu trả lời:


72

Lanczos tái định hình là gì?

Mặc dù lý thuyết được mô tả trong một bài báo sớmbài viết trên Wikipedia , "cảm giác" đối với các phương pháp lấy mẫu lại có được tốt nhất bằng cách tính toán chúng trên các hình ảnh đơn giản hoặc tiêu chuẩn. Đây có thể là một chủ đề rộng lớn, đòi hỏi thử nghiệm rộng rãi, nhưng một số đơn giản hóa có sẵn:

  • Các toán tử này làm việc riêng trong từng kênh màu. Do đó, đủ để nghiên cứu cách chúng hoạt động trên một hình ảnh đơn sắc ("đen trắng").

  • Hầu hết các toán tử tích chập được sử dụng trong xử lý ảnh đều hoạt động theo cùng một hướng theo hướng x và y và độc lập theo cả hai hướng. Trong thực tế, chúng thực sự là các toán tử một chiều được áp dụng đầu tiên cho các hàng và sau đó cho các cột. Điều này có nghĩa là chúng ta có thể nghiên cứu chúng bằng cách nghiên cứu các hình ảnh "1D", có thể được vẽ chi tiết.

  • Mọi thứ chúng ta cần biết về một toán tử tuyến tính (bao gồm tất cả các toán tử tích chập) có thể được suy ra từ cách một toán tử hoạt động trên hình ảnh không cố định đơn giản nhất của tất cả: đây là một bước nhảy đột ngột từ giá trị này sang giá trị khác.

Chúng ta hãy xem một minh họa về một số phương pháp lấy mẫu phổ biến. Trên thực tế, chúng ta cần hai hình minh họa: một để hiển thị những gì xảy ra trong "downsampling", trong đó hình ảnh mới thô hơn hình cũ và hình khác để xem "upampling", trong đó hình ảnh mới là sự tinh chỉnh của cái cũ. Hãy bắt đầu với cái sau, bởi vì nó hiển thị chi tiết hơn.

Upsampling

Lấy mẫu lại từ 7 đến 80 ô dưới dạng hình ảnh

Hình ảnh 7 x 7 gốc bên trái thực sự là một chiều vì mỗi hàng là như nhau. Việc lấy mẫu lại xảy ra trên các cột. Kích thước của năm hình ảnh khác là 80 x 80, hiển thị chi tiết cách mỗi phương thức nội suy giữa các pixel thô ban đầu. Lấy mẫu lân cận gần nhất giữ lại sự phân chia sắc nét giữa tối và sáng trong khi bốn phương pháp còn lại làm mờ vùng can thiệp ở một mức độ nào đó. Đáng chú ý, bộ cộng hưởng Lanczos tạo ra một số vùng tối hơn bất kỳ vùng nào trong bản gốc và các vùng khác nhẹ hơn bất kỳ vùng nào trong bản gốc. (Điều này có thể có ý nghĩa đối với công việc của GIS, bởi vì ngoại suy như vậycủa các giá trị ban đầu có khả năng có thể khiến các giá trị mới không hợp lệ. Chúng cũng có thể mở rộng ra ngoài phạm vi của bản đồ màu gốc, đôi khi làm cho các giá trị cực đoan trong hình ảnh lấy mẫu lại được hiển thị không chính xác. Đây là một vấn đề với việc lấy lại tích chập hai chiều trong ArcGIS chẳng hạn.)

(NB: Phương pháp "bicubic" được hiển thị ở đây là một spline hai chiều, không phải là "tích chập hai chiều" của ArcGIS.)

Sử dụng độ sáng để mô tả các giá trị hình ảnh, mặc dù tự nhiên, không chính xác lắm. Hình minh họa tiếp theo khắc phục điều này bằng cách vẽ đồ thị các giá trị ô (trục dọc) theo cột (trục ngang).

Lấy mẫu lại từ 7 đến 80 ô dưới dạng ô

Giá trị thấp hơn trên biểu đồ tương ứng với các phần tối hơn của hình ảnh. Một cuộc kiểm tra chu đáo về bản gốc đã phát hiện ra một giả định ẩn: mặc dù hình ảnh ban đầu trông giống như một cú nhảy mạnh từ tối sang sáng, nhưng bước nhảy thực sự xảy ra trong một phần bảy (1/7) phạm vi của các cột. Ai sẽ nói những gì thực sự xảy ra trong khoảng thời gian đó trong cảnh ban đầu mà hình ảnh được mô tả? Do đó, chúng ta không nên quá quan trọng về sự khác biệt giữa các phương pháp lấy mẫu lại xảy ra trong khoảng thời gian ngắn này: mỗi phương pháp sẽ đưa ra một kết xuất khác nhau nhưng có khả năng như nhau về những gì thể xảy ra trong cảnh ban đầu. Theo nghĩa này, không còn rõ ràng rằng lấy mẫu lân cận gần nhất là phương pháp nội suy trung thực nhất.

Một kết luận chúng ta nên rút ra là độ chính xác của bất kỳ phương pháp lấy mẫu nào phụ thuộc vào bản chất của cảnh bên dưới . Nếu cảnh bao gồm các giá trị sẽ thay đổi trơn tru từ điểm này sang điểm tiếp theo, thì phương pháp lân cận gần nhất có thể cách lấy lại ít trung thực nhất trong số các điểm được hiển thị.

Downsampling

Hình ảnh xuống

Ở đây chúng ta thấy kết quả của việc ghép xuống một hình ảnh 16 x 16 đến 8 x 8 (tổng hợp 2 nhân 2). Hàng xóm gần nhất giữ chính xác ranh giới sắc nét. Lanczos khác với những người khác bằng cách tăng cường độ sắc nét rõ ràng. Nhìn kỹ cho thấy nó làm tối khu vực tối ở một bên của ranh giới và làm sáng khu vực ánh sáng ở phía bên kia. Các biểu đồ làm rõ điều này:

Đồ thị của hình ảnh xuống

Các bộ cộng hưởng song tuyến, nhị phân và Gaussian cho thấy các đặc điểm của toán tử tích chập có tất cả các trọng số dương (hoặc các trọng số âm rất nhỏ): chúng trung bình hoặc "bôi nhọ" các giá trị lân cận. Trong downsampling điều này làm cho các tính năng sắc nét bị mờ. Mức độ mờ phụ thuộc vào chiều rộng của hạt nhân. Giống như những người khác, bộ cộng hưởng Lanczos cũng làm mờ bước nhảy, nhưng nó "vượt qua" nó ở cả hai bên. Đó là sự tăng cường độ tương phản nhìn thấy ngay phía trên trong hình ảnh. Do xu hướng này làm tăng độ tương phản (sự khác biệt cục bộ giữa mức cao và mức thấp trong hình ảnh), bộ cộng hưởng Lanczos thường được gọi là "bộ lọc làm sắc nét". Những biểu đồ này cho thấy đặc tính này đòi hỏi một sự hiểu biết sắc thái, bởi vì rõ ràng nó không thực sự làm giảm trung bình các giá trị ở cả hai phía của bước nhảy. Ở pixel 4, giá trị 0,56 của nó tương đương với các giá trị được tính toán bởi các bộ lọc tích chập khác.

Làm thế nào để sử dụng nó ảnh hưởng đến đầu ra?

Chúng ta hãy xem những gì xảy ra trong một hình ảnh phức tạp hơn.

Các hình ảnh phức tạp

Bản gốc, hình ảnh 13 x 13 hiện bao gồm một mẫu có tần số không gian cao nhất có thể (xen kẽ giữa sáng và tối với mỗi cột ở bên phải). Chúng tôi không thể hy vọng tái tạo các tính năng như vậy khi downsampling: số lượng pixel nhỏ hơn đơn giản là không thể chứa tất cả thông tin này. Sau đó, hãy tập trung vào những gì xảy ra khi một hình ảnh như vậy bị xáo trộn. Nếu chúng ta quan tâm đến việc tái tạo trung thực cảnh, chúng ta sẽ muốn mô hình tần số cao này được sao chép chính xác.

Các hình ảnh nhỏ hơn được ghép lại thành 25 x 25 pixel: gần như, nhưng không hoàn toàn, tỷ lệ tinh chỉnh 2: 1. Trước mắt tôi, các phương pháp Lanczos và bilinear tái tạo các sọc mạnh nhất trong số bốn bộ chuyển đổi tích chập. Người hàng xóm gần nhất dĩ nhiên là người trung thành nhất (vì nó không thể có giá trị trung bình nào cả).

Đồ thị của hình ảnh phức tạp được ghép lại

Những biểu đồ có cùng kết quả này cho thấy bộ cộng hưởng Lanczos có thể duy trì độ tương phản trong các sọc (như được thấy bởi kích thước của dao động thẳng đứng từ mức thấp đến mức cao) với chi phí đưa ra sự thay đổi cường độ trong ánh sáng giá trị không đổi khu vực ở giữa hình ảnh (pixel 5, 6, 7 của bản gốc). Biến thể này hiển thị dưới dạng các tạo tác giống như sọc trong phần ánh sáng của hình ảnh (ở giữa). Trong số các resamplers được hiển thị ở đây, nó là một mình trong việc giới thiệu chi tiết giả như vậy.

Nó có ích gì trong ứng dụng không gian?

Rõ ràng, việc tái định hình Lanczos không phải là giải pháp chữa bách bệnh hay omnibus để tái định hình. Nó vượt trội so với nhiều bộ giải mã tích chập khác trong việc duy trì (hoặc thậm chí tăng cường) độ tương phản cục bộ. Điều này có thể hữu ích khi hình ảnh được ghép lại được dùng để xem nhận dạng các tính năng hoặc ranh giới chi tiết. Khi hình ảnh được ghép lại sau đó sẽ được phân tích hoặc xử lý, việc lấy mẫu lại Lanczos có thể tăng khả năng phát hiện các cạnh và các tính năng tuyến tính.

Tuy nhiên, khi hình ảnh được ghép lại sẽ được phân tích theo những cách khác, những lợi ích của việc lấy mẫu lại Lanczos rất đáng nghi ngờ. Nó thường sẽ (giả tạo) làm tăng các biện pháp biến đổi không gian cục bộ, chẳng hạn như phạm vi tiêu cự và độ lệch chuẩn tiêu cự. Nó sẽ không ảnh hưởng đến các phương tiện không gian trên toàn bộ - giống như các bộ thay đổi tích chập khác, nó thường được chuẩn hóa (có nghĩa là trung bình có trọng số cục bộ, không có sai lệch giới thiệu) - nhưng nó có thể tăng một số trung bình cục bộ và giảm các giá trị khác so với các đại lý khác.

Đánh giá (nhất thiết phải ngắn gọn) ở đây cho thấy không nên sử dụng bộ cộng hưởng Lanczos để lấy mẫu xuống: đối với ứng dụng đó, dường như không cung cấp phương thức nào đơn giản hơn (và phổ biến hơn), trong đó vẫn giữ được nhược điểm tiềm tàng là ngoại suy ngoài phạm vi ban đầu của các giá trị dữ liệu.

Afterword: một nhận xét chung

Cuộc điều tra được mô tả ở đây là một ví dụ về những gì mọi người có thể làm khi họ có câu hỏi về cách hoạt động của hệ thống GIS. Nó sử dụng chính GIS làm đối tượng điều tra: để biết một số phương pháp hoạt động hoặc phân tích làm gì, chỉ cần áp dụng nó trong các điều kiện thí nghiệm được kiểm soát. Trong trường hợp này, việc xây dựng các hình ảnh thử nghiệm đơn giản, lấy mẫu lại theo các phương pháp có sẵn và kiểm tra kết quả.

Có ba khía cạnh quan trọng của phương pháp này để tìm hiểu về cách thức hoạt động của GIS:

  1. Lý thuyết . Các thử nghiệm thường không thể được thực hiện "mù": nó giúp biết một số lý thuyết. Chúng ta thường không cần biết nhiều, nhưng chúng ta cần những điều cơ bản. Trong trường hợp này, lý thuyết về sự kết hợp đã làm giảm đáng kể số lượng và loại hình ảnh mà chúng ta cần thử nghiệm. Chúng tôi không cần biết gì về phân tích Fourier, v.v. (Đừng nhầm, kiến ​​thức như vậy có lợi. Nhưng thiếu kiến ​​thức chuyên môn về loại này không nên ngăn chúng tôi lại.)
  2. Thực hành . Bằng cách sử dụng chính hệ thống GIS của chúng tôi để thực hiện thử nghiệm, chúng tôi có thể thấy những gì nó thực sự làm . Điều này tránh sự ngắt kết nối giữa lý thuyết (cho chúng ta biết phần mềm nên làm gì) và thực hành (đó là những gì nó thực sự làm).
  3. Định lượng . Trừ khi câu hỏi liên quan đến nhận thức trực quan, để đánh giá kết quả, chúng ta không nên chỉ dựa vào việc nhìn vào bản đồ (hoặc, trong trường hợp này là hình ảnh). Để có được thông tin tốt nhất, chúng ta cần định lượng đầu ra (được thực hiện ở đây bằng các biểu đồ) và, thường, mô tả và tóm tắt nó bằng các phương pháp thống kê.

3

Bạn có thể biết các bộ lọc Lanczos hoặc loại bộ lọc tương tự từ các chương trình hình ảnh của bạn, nơi chúng thường được gọi là 'bộ lọc làm sắc nét'. Một ví dụ điển hình từ forumtopic này : Hình ảnh đầu tiên hiển thị tệp gốc và bên cạnh nó trông như thế nào sau khi giảm kích thước lưới nếu bạn sử dụng phương pháp nội suy trơn tru (như lấy mẫu theo đường chéo bicubic).

http://peltarion.eu/img/comp/moire/D_lanczos3.jpg Tuy nhiên, nếu bạn áp dụng bộ lọc Lanczos cho hình ảnh này hoặc sử dụng nó để lấy mẫu lại, sự khác biệt được khuếch đại, bạn có thể nói rằng độ tương phản được tăng cục bộ. nhập mô tả hình ảnh ở đây

Trong trường hợp dữ liệu không gian, điều này có thể rất hữu ích: hãy tưởng tượng bạn đang cố gắng giảm bản đồ đa giác có lưới hoặc nếu bạn muốn chạy các thuật toán dựa vào phát hiện cạnh (ví dụ: số hóa bản đồ đa giác được quét, phân đoạn hình ảnh ( ví dụ )).

Mặt khác, bạn mất một số độ chính xác không gian. Hãy tưởng tượng rằng bản đồ 16x16 thể hiện sự ô nhiễm không khí trong một thành phố, hơn là việc lấy mẫu lại sử dụng giá trị trung bình sẽ thể hiện đầy đủ hơn tình trạng ô nhiễm không khí trung bình trong ô lưới đó.


Tôi không nghĩ những hình ảnh này là những gì bạn yêu cầu. Phía trên bên phải rõ ràng không phải là ý nghĩa của tế bào; nếu có, các sọc dọc ở góc phần tư phía trên bên trái của nó sẽ không ở đó. Một số hình thức "làm sắc nét" đã được áp dụng cho hình ảnh đó để lấy hình bên dưới nó (phía dưới bên phải), có biệt danh sai: đây không phải là bảo tồn các tính năng, mà là tạo ra các tạo tác. Bởi vì (hầu hết) tất cả các bộ lọc đều được chuẩn hóa đơn vị, bao gồm các bộ lọc Lanczos, quan điểm của bạn về giá trị trung bình áp dụng cho mọi bộ lọc , không chỉ có nghĩa là một vùng lân cận không có trọng số, và do đó không phải là một đặc điểm khác biệt.
whuber

Tôi đã tích hợp ý kiến ​​của bạn. Nhưng trong tế bào, bộ nội suy trơn rất có thể sẽ mang lại dự đoán tốt hơn
johanvdw

-1

Từ Wikipedia :

Lấy mẫu lại Lanczos (phát âm tiếng Hungary: [laːntsoʃ]) là một phương pháp nội suy được sử dụng để tính toán các giá trị mới cho dữ liệu được lấy mẫu. Nó thường được sử dụng trong phép nội suy đa biến, ví dụ để chia tỷ lệ hình ảnh (để thay đổi kích thước hình ảnh kỹ thuật số), nhưng có thể được sử dụng cho bất kỳ tín hiệu kỹ thuật số nào khác. Hạt nhân Lanczos cho biết mẫu nào trong dữ liệu gốc và theo tỷ lệ nào, tạo thành từng mẫu của dữ liệu cuối cùng. Bộ lọc được đặt tên theo Cornelius Lanczos, bởi vì ông đã chỉ ra cách sử dụng chuỗi Fourier và đa thức Ch Quashev cho các vấn đề khác nhau mà trước đây nó không được sử dụng.

Ứng dụng : Bộ lọc Lanczos là một dạng cửa sổ của bộ lọc chân, bộ lọc thông thấp "tường gạch" tối ưu về mặt lý thuyết. Hàm chân là vô hạn trong phạm vi, và do đó không thể sử dụng trực tiếp trong thực tế. Thay vào đó, người ta sử dụng các xấp xỉ, được gọi là các dạng cửa sổ của bộ lọc, như được thảo luận trong các chức năng của cửa sổ: thiết kế bộ lọc và bộ lọc Lanczos là một cửa sổ như vậy. Các cửa sổ biến mất bên ngoài một phạm vi và sử dụng phạm vi lớn hơn cho phép người ta cải thiện độ chính xác để đổi lấy nhiều tính toán hơn.

Đánh giá : Bộ lọc Lanczos đã được so sánh với các bộ lọc khác, đặc biệt là các cửa sổ khác của bộ lọc chân. Một số người đã tìm thấy Lanczos (với a = 2) "sự thỏa hiệp tốt nhất về việc giảm răng cưa, độ sắc nét và tiếng chuông tối thiểu", so với sự chân thành bị cắt cụt và Barlett, cosine và Hann chân thành.

Giới hạn : Vì hạt nhân giả định các giá trị âm cho a> 1, các giá trị đầu ra có thể âm ngay cả với đầu vào không âm. Các giá trị âm nằm ngoài giới hạn cho tín hiệu hình ảnh và gây ra các hiện vật cắt. Thùy âm cũng gây ra các tạo tác chuông.

Tuy nhiên, cả bộ lọc dưới và chuông đều giảm so với bộ lọc chân không (không có cửa sổ), do cửa sổ; tiếng chuông đặc biệt nhỏ, vì kích thước thùy bên dương tính thể hiện, đặc biệt là với a = 2.


Tại sao lại bỏ phiếu? Có gì sai với câu trả lời này? Tôi đã đưa ra các liên kết ban đầu là tốt.
Chethan S.

7
Tôi không thấy cách trích xuất wiki trả lời câu hỏi về tác động của bộ lọc Lanczos đối với dữ liệu không gian và nó sẽ hữu ích cho việc gì.
underdark

Đúng. Tôi chỉ đưa ra câu trả lời theo nghĩa chung cho What Lanczos và việc sử dụng nó ảnh hưởng đến đầu ra như thế nào?
Chethan S.

9
Hầu hết bài viết trên Wikipedia này quá mơ hồ để có ích (như những người khác đã lưu ý trước đó). Câu trả lời thực sự nằm ở câu cuối cùng, nhưng chỉ có thể hiểu được bởi một người biết "nhấp nhô" và "đổ chuông" là gì (hay còn gọi là "dao động Gibbs" trong 2D), biết những gì được đề cập bởi "mặt tích cực thùy, "và hiểu sâu sắc mối quan hệ giữa các hình dạng hạt nhân và ảnh hưởng của chúng đối với các biến đổi Fourier. Nói tóm lại, để dễ hiểu và hữu ích, câu trả lời này cần một số khuếch đại.
whuber
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.