Lanczos tái định hình là gì?
Mặc dù lý thuyết được mô tả trong một bài báo sớm và bài viết trên Wikipedia , "cảm giác" đối với các phương pháp lấy mẫu lại có được tốt nhất bằng cách tính toán chúng trên các hình ảnh đơn giản hoặc tiêu chuẩn. Đây có thể là một chủ đề rộng lớn, đòi hỏi thử nghiệm rộng rãi, nhưng một số đơn giản hóa có sẵn:
Các toán tử này làm việc riêng trong từng kênh màu. Do đó, đủ để nghiên cứu cách chúng hoạt động trên một hình ảnh đơn sắc ("đen trắng").
Hầu hết các toán tử tích chập được sử dụng trong xử lý ảnh đều hoạt động theo cùng một hướng theo hướng x và y và độc lập theo cả hai hướng. Trong thực tế, chúng thực sự là các toán tử một chiều được áp dụng đầu tiên cho các hàng và sau đó cho các cột. Điều này có nghĩa là chúng ta có thể nghiên cứu chúng bằng cách nghiên cứu các hình ảnh "1D", có thể được vẽ chi tiết.
Mọi thứ chúng ta cần biết về một toán tử tuyến tính (bao gồm tất cả các toán tử tích chập) có thể được suy ra từ cách một toán tử hoạt động trên hình ảnh không cố định đơn giản nhất của tất cả: đây là một bước nhảy đột ngột từ giá trị này sang giá trị khác.
Chúng ta hãy xem một minh họa về một số phương pháp lấy mẫu phổ biến. Trên thực tế, chúng ta cần hai hình minh họa: một để hiển thị những gì xảy ra trong "downsampling", trong đó hình ảnh mới thô hơn hình cũ và hình khác để xem "upampling", trong đó hình ảnh mới là sự tinh chỉnh của cái cũ. Hãy bắt đầu với cái sau, bởi vì nó hiển thị chi tiết hơn.
Upsampling
Hình ảnh 7 x 7 gốc bên trái thực sự là một chiều vì mỗi hàng là như nhau. Việc lấy mẫu lại xảy ra trên các cột. Kích thước của năm hình ảnh khác là 80 x 80, hiển thị chi tiết cách mỗi phương thức nội suy giữa các pixel thô ban đầu. Lấy mẫu lân cận gần nhất giữ lại sự phân chia sắc nét giữa tối và sáng trong khi bốn phương pháp còn lại làm mờ vùng can thiệp ở một mức độ nào đó. Đáng chú ý, bộ cộng hưởng Lanczos tạo ra một số vùng tối hơn bất kỳ vùng nào trong bản gốc và các vùng khác nhẹ hơn bất kỳ vùng nào trong bản gốc. (Điều này có thể có ý nghĩa đối với công việc của GIS, bởi vì ngoại suy như vậycủa các giá trị ban đầu có khả năng có thể khiến các giá trị mới không hợp lệ. Chúng cũng có thể mở rộng ra ngoài phạm vi của bản đồ màu gốc, đôi khi làm cho các giá trị cực đoan trong hình ảnh lấy mẫu lại được hiển thị không chính xác. Đây là một vấn đề với việc lấy lại tích chập hai chiều trong ArcGIS chẳng hạn.)
(NB: Phương pháp "bicubic" được hiển thị ở đây là một spline hai chiều, không phải là "tích chập hai chiều" của ArcGIS.)
Sử dụng độ sáng để mô tả các giá trị hình ảnh, mặc dù tự nhiên, không chính xác lắm. Hình minh họa tiếp theo khắc phục điều này bằng cách vẽ đồ thị các giá trị ô (trục dọc) theo cột (trục ngang).
Giá trị thấp hơn trên biểu đồ tương ứng với các phần tối hơn của hình ảnh. Một cuộc kiểm tra chu đáo về bản gốc đã phát hiện ra một giả định ẩn: mặc dù hình ảnh ban đầu trông giống như một cú nhảy mạnh từ tối sang sáng, nhưng bước nhảy thực sự xảy ra trong một phần bảy (1/7) phạm vi của các cột. Ai sẽ nói những gì thực sự xảy ra trong khoảng thời gian đó trong cảnh ban đầu mà hình ảnh được mô tả? Do đó, chúng ta không nên quá quan trọng về sự khác biệt giữa các phương pháp lấy mẫu lại xảy ra trong khoảng thời gian ngắn này: mỗi phương pháp sẽ đưa ra một kết xuất khác nhau nhưng có khả năng như nhau về những gì có thể xảy ra trong cảnh ban đầu. Theo nghĩa này, không còn rõ ràng rằng lấy mẫu lân cận gần nhất là phương pháp nội suy trung thực nhất.
Một kết luận chúng ta nên rút ra là độ chính xác của bất kỳ phương pháp lấy mẫu nào phụ thuộc vào bản chất của cảnh bên dưới . Nếu cảnh bao gồm các giá trị sẽ thay đổi trơn tru từ điểm này sang điểm tiếp theo, thì phương pháp lân cận gần nhất có thể là cách lấy lại ít trung thực nhất trong số các điểm được hiển thị.
Downsampling
Ở đây chúng ta thấy kết quả của việc ghép xuống một hình ảnh 16 x 16 đến 8 x 8 (tổng hợp 2 nhân 2). Hàng xóm gần nhất giữ chính xác ranh giới sắc nét. Lanczos khác với những người khác bằng cách tăng cường độ sắc nét rõ ràng. Nhìn kỹ cho thấy nó làm tối khu vực tối ở một bên của ranh giới và làm sáng khu vực ánh sáng ở phía bên kia. Các biểu đồ làm rõ điều này:
Các bộ cộng hưởng song tuyến, nhị phân và Gaussian cho thấy các đặc điểm của toán tử tích chập có tất cả các trọng số dương (hoặc các trọng số âm rất nhỏ): chúng trung bình hoặc "bôi nhọ" các giá trị lân cận. Trong downsampling điều này làm cho các tính năng sắc nét bị mờ. Mức độ mờ phụ thuộc vào chiều rộng của hạt nhân. Giống như những người khác, bộ cộng hưởng Lanczos cũng làm mờ bước nhảy, nhưng nó "vượt qua" nó ở cả hai bên. Đó là sự tăng cường độ tương phản nhìn thấy ngay phía trên trong hình ảnh. Do xu hướng này làm tăng độ tương phản (sự khác biệt cục bộ giữa mức cao và mức thấp trong hình ảnh), bộ cộng hưởng Lanczos thường được gọi là "bộ lọc làm sắc nét". Những biểu đồ này cho thấy đặc tính này đòi hỏi một sự hiểu biết sắc thái, bởi vì rõ ràng nó không thực sự làm giảm trung bình các giá trị ở cả hai phía của bước nhảy. Ở pixel 4, giá trị 0,56 của nó tương đương với các giá trị được tính toán bởi các bộ lọc tích chập khác.
Làm thế nào để sử dụng nó ảnh hưởng đến đầu ra?
Chúng ta hãy xem những gì xảy ra trong một hình ảnh phức tạp hơn.
Bản gốc, hình ảnh 13 x 13 hiện bao gồm một mẫu có tần số không gian cao nhất có thể (xen kẽ giữa sáng và tối với mỗi cột ở bên phải). Chúng tôi không thể hy vọng tái tạo các tính năng như vậy khi downsampling: số lượng pixel nhỏ hơn đơn giản là không thể chứa tất cả thông tin này. Sau đó, hãy tập trung vào những gì xảy ra khi một hình ảnh như vậy bị xáo trộn. Nếu chúng ta quan tâm đến việc tái tạo trung thực cảnh, chúng ta sẽ muốn mô hình tần số cao này được sao chép chính xác.
Các hình ảnh nhỏ hơn được ghép lại thành 25 x 25 pixel: gần như, nhưng không hoàn toàn, tỷ lệ tinh chỉnh 2: 1. Trước mắt tôi, các phương pháp Lanczos và bilinear tái tạo các sọc mạnh nhất trong số bốn bộ chuyển đổi tích chập. Người hàng xóm gần nhất dĩ nhiên là người trung thành nhất (vì nó không thể có giá trị trung bình nào cả).
Những biểu đồ có cùng kết quả này cho thấy bộ cộng hưởng Lanczos có thể duy trì độ tương phản trong các sọc (như được thấy bởi kích thước của dao động thẳng đứng từ mức thấp đến mức cao) với chi phí đưa ra sự thay đổi cường độ trong ánh sáng giá trị không đổi khu vực ở giữa hình ảnh (pixel 5, 6, 7 của bản gốc). Biến thể này hiển thị dưới dạng các tạo tác giống như sọc trong phần ánh sáng của hình ảnh (ở giữa). Trong số các resamplers được hiển thị ở đây, nó là một mình trong việc giới thiệu chi tiết giả như vậy.
Nó có ích gì trong ứng dụng không gian?
Rõ ràng, việc tái định hình Lanczos không phải là giải pháp chữa bách bệnh hay omnibus để tái định hình. Nó vượt trội so với nhiều bộ giải mã tích chập khác trong việc duy trì (hoặc thậm chí tăng cường) độ tương phản cục bộ. Điều này có thể hữu ích khi hình ảnh được ghép lại được dùng để xem nhận dạng các tính năng hoặc ranh giới chi tiết. Khi hình ảnh được ghép lại sau đó sẽ được phân tích hoặc xử lý, việc lấy mẫu lại Lanczos có thể tăng khả năng phát hiện các cạnh và các tính năng tuyến tính.
Tuy nhiên, khi hình ảnh được ghép lại sẽ được phân tích theo những cách khác, những lợi ích của việc lấy mẫu lại Lanczos rất đáng nghi ngờ. Nó thường sẽ (giả tạo) làm tăng các biện pháp biến đổi không gian cục bộ, chẳng hạn như phạm vi tiêu cự và độ lệch chuẩn tiêu cự. Nó sẽ không ảnh hưởng đến các phương tiện không gian trên toàn bộ - giống như các bộ thay đổi tích chập khác, nó thường được chuẩn hóa (có nghĩa là trung bình có trọng số cục bộ, không có sai lệch giới thiệu) - nhưng nó có thể tăng một số trung bình cục bộ và giảm các giá trị khác so với các đại lý khác.
Đánh giá (nhất thiết phải ngắn gọn) ở đây cho thấy không nên sử dụng bộ cộng hưởng Lanczos để lấy mẫu xuống: đối với ứng dụng đó, dường như không cung cấp phương thức nào đơn giản hơn (và phổ biến hơn), trong đó vẫn giữ được nhược điểm tiềm tàng là ngoại suy ngoài phạm vi ban đầu của các giá trị dữ liệu.
Afterword: một nhận xét chung
Cuộc điều tra được mô tả ở đây là một ví dụ về những gì mọi người có thể làm khi họ có câu hỏi về cách hoạt động của hệ thống GIS. Nó sử dụng chính GIS làm đối tượng điều tra: để biết một số phương pháp hoạt động hoặc phân tích làm gì, chỉ cần áp dụng nó trong các điều kiện thí nghiệm được kiểm soát. Trong trường hợp này, việc xây dựng các hình ảnh thử nghiệm đơn giản, lấy mẫu lại theo các phương pháp có sẵn và kiểm tra kết quả.
Có ba khía cạnh quan trọng của phương pháp này để tìm hiểu về cách thức hoạt động của GIS:
- Lý thuyết . Các thử nghiệm thường không thể được thực hiện "mù": nó giúp biết một số lý thuyết. Chúng ta thường không cần biết nhiều, nhưng chúng ta cần những điều cơ bản. Trong trường hợp này, lý thuyết về sự kết hợp đã làm giảm đáng kể số lượng và loại hình ảnh mà chúng ta cần thử nghiệm. Chúng tôi không cần biết gì về phân tích Fourier, v.v. (Đừng nhầm, kiến thức như vậy có lợi. Nhưng thiếu kiến thức chuyên môn về loại này không nên ngăn chúng tôi lại.)
- Thực hành . Bằng cách sử dụng chính hệ thống GIS của chúng tôi để thực hiện thử nghiệm, chúng tôi có thể thấy những gì nó thực sự làm . Điều này tránh sự ngắt kết nối giữa lý thuyết (cho chúng ta biết phần mềm nên làm gì) và thực hành (đó là những gì nó thực sự làm).
- Định lượng . Trừ khi câu hỏi liên quan đến nhận thức trực quan, để đánh giá kết quả, chúng ta không nên chỉ dựa vào việc nhìn vào bản đồ (hoặc, trong trường hợp này là hình ảnh). Để có được thông tin tốt nhất, chúng ta cần định lượng đầu ra (được thực hiện ở đây bằng các biểu đồ) và, thường, mô tả và tóm tắt nó bằng các phương pháp thống kê.