Câu trả lời:
Quá trình này rất phức tạp nhưng điều này sẽ cho một trực giác về những gì đang diễn ra. Hãy tưởng tượng bạn có một máy ảnh thông thường, nhưng với động cơ để di chuyển cảm biến nửa pixel theo bất kỳ hướng nào.
Thay vì chụp một ảnh, máy ảnh này mất bốn: một ở giữa, một thay đổi một nửa pixel bên phải, một thay đổi một nửa pixel xuống và một thay đổi một nửa pixel bên phải và một nửa pixel xuống.
Sau đó, chúng ta có thể lấy hình ảnh ở giữa, làm cho nó tăng gấp đôi kích thước, cách nhau các pixel như sau:
xxxx x x x x
xxxx ____\
xxxx / x x x x
xxxx
x x x x
x x x x
Sau đó, chúng ta có thể điền vào các khoảng trống, sử dụng các hình ảnh được dịch chuyển khác, 1, 2 và 3:
x1x1x1x1
23232323
x1x1x1x1
23232323
x1x1x1x1
23232323
x1x1x1x1
23232323
Để lại cho chúng tôi một hình ảnh của độ phân giải gấp đôi. Điều thú vị là có nhiều máy ảnh hơn sử dụng kỹ thuật này - chẳng hạn như Hasselblad H4D-200MS (xin lỗi nếu bạn phải hỏi bạn không đủ khả năng chi trả bao nhiêu).
Siêu phân giải với máy ảnh tiêu chuẩn phức tạp hơn một chút vì khi bạn không kiểm soát được máy ảnh hoặc chuyển động chủ thể, bạn không nhận được bất cứ nơi nào gần một nửa pixel chính xác, nhưng trừ khi bạn cực kỳ không may mắn, hình ảnh bị thay đổi của bạn sẽ bị lệch một chút so với ban đầu. Bằng cách kết hợp đủ hình ảnh, bạn sẽ có được một hình ảnh được lấy mẫu rất bất thường (với các mẫu pixel không rơi vào lưới) nhưng một hình ảnh có thể được nội suy (bằng cách vạch các đường giữa các mẫu để đoán kết quả rơi vào đường lưới chính xác) vào một hình ảnh thông thường.
Hãy xem xét rằng cảm biến không phải là một thiết bị chụp hoàn hảo. Mỗi pixel sẽ được ghi lại với một số lượng lỗi. Ví dụ: nếu giá trị chính xác nhất của pixel là N
, cảm biến sẽ ghi lại một giá trị nằm trong phạm vi N-E to N+E
cho trước E
. Đối với một cảm biến tốt E
là nhỏ, một cảm biến xấu sẽ có một cảm biến lớn hơn E
.
Cũng lưu ý rằng trên mỗi lần phơi sáng, một pixel nhất định sẽ có một lỗi khác nhau, các ô trong cảm biến không có bộ nhớ, do đó, một pixel xuất hiện ở mức thấp một lần có thể xuất hiện cao trong lần tiếp theo.
Khi bạn thực hiện một số lần phơi sáng của cùng một chủ đề và tính trung bình chúng với nhau, bạn sẽ giảm một cách hiệu quả E
. Đối với pixel ví dụ của chúng tôi ở trên, bạn sẽ lấy trung bình một loạt các giá trị khác nhau xung quanh một ẩn số N
, vì vậy mức trung bình sẽ đưa bạn đến gần hơn với lý tưởng đó N
.
Sau đây là những gì tôi hiểu. Mọi người nên thoải mái chỉ ra bất kỳ quan niệm sai lầm nào để tất cả chúng ta đều được chỉnh sửa, nhưng hy vọng sẽ thực sự chỉ ra bất kỳ điều gì họ phát hiện ra và không chỉ lẩm bẩm trong bia của họ. (hoặc râu hoặc ...).
Nói một cách đơn giản và đơn giản, có một chút thông tin khác nhau trong các bức ảnh khác nhau và các phương pháp khác nhau được sử dụng để phát hiện và trích xuất thông tin bổ sung này và kết hợp nó theo cách phụ gia nhất quán.
Điều đáng chú ý là hệ thống không được đảm bảo hoạt động trong mọi trường hợp.
[Trang siêu phân giải Wikipedia] ghi chú:
Trong các thuật toán SR phổ biến nhất, thông tin thu được trong hình ảnh SR được nhúng vào hình ảnh LR dưới dạng răng cưa.
Điều này đòi hỏi cảm biến chụp trong hệ thống đủ yếu để răng cưa thực sự xảy ra. Một hệ thống hạn chế nhiễu xạ không chứa răng cưa, cũng như một hệ thống có chức năng Truyền điều chế toàn bộ hệ thống đang lọc ra nội dung tần số cao.
Aliasing là khả năng hệ thống trình bày đúng dữ liệu của các tần số liên quan. Xem "giải thích" là kết thúc.
Nếu tôi hiểu chính xác (và tôi có thể hoặc không) thì cụm từ của họ "đủ yếu" có nghĩa là thông tin bổ sung mà cảm biến không thể tự giải quyết được thường bị coi là xấu nên thường bị loại bỏ khi VBUT có thể "bí danh" hệ thống SR cần thêm thông tin. Nikon D800r không có bộ lọc quang chống phản xạ trên cảm biến trong khi D800 và hầu hết các máy DSLR khác đều có bộ lọc như vậy.
MTF thực sự là khả năng của ống kính tạo ra độ tương phản HOẶC tạo ra "độ sắc nét" (hai cái này có liên quan chặt chẽ với nhau. MTF tốt nhất là gần giữa ống kính và, với hình ảnh hình chữ nhật, rơi xuống các cạnh và thường nhiều hơn ở các góc hình ảnh Họ đang nói rằng khả năng hệ thống tạo ra hình ảnh siêu phân giải phụ thuộc vào khả năng hiển thị độ tương phản và độ sắc nét của nó - tức là vào chất lượng của nó. Tức là ống kính cần ít nhất là tốt như ống kính sẽ tạo ra siêu phẩm rsolutionj iomage trực tiếp nếu khả năng cảm biến và quy trình được cải thiện.
Bí danh là những gì xảy ra khi một luồng thông tin được lấy mẫu chậm đến mức một số thông tin tần số cao thay đổi nhanh hơn so với tốc độ lấy mẫu và "bao bọc xung quanh" và xuất hiện như thể nó thực sự là một thành phần tần số thấp hơn. Trong một hệ thống giới hạn, tốc độ lấy mẫu cần ít nhất gấp đôi tốc độ thông tin cao nhất hiện có nhưng trên thực tế tỷ lệ cao hơn mức này là bắt buộc.
Ví dụ đơn giản:
Xét chuỗi 0 1 2 3 4 5 6 5 4 3 2 1 0 1 2 3 4 5 6 5 4 3 2 1 0 1 2 3 4 5 6 ...
Rõ ràng có một mô hình lặp lại cứ sau 12 đơn vị.
Đó là một tam giác ave tăng trong 6 chu kỳ và giảm trong 6 chu kỳ khác và sau đó lặp lại, với period = 12 đơn vị.
Bây giờ chỉ lấy mẫu trình tự mỗi lần thứ 11. Chúng ta nhận được
0 1 2 3 4 5 6 5 4 3 2 1
Đây chính xác là cùng một mẫu NHƯNG nó thay đổi chậm hơn 11 lần - một sóng tam giác có chu kỳ 11 x 12 = 132 đơn vị.
Lấy mẫu tương tự mỗi lần thứ 8 và bạn nhận được 0 4 4 0 4 4 0 4 4
tức là nó trông giống như một sóng vuông 1: 2 với chu kỳ = 24 đơn vị.
Bất kỳ khoảng thời gian lấy mẫu nào lớn hơn 6 đơn vị thời gian = nửa chu kỳ sẽ dẫn đến các lỗi răng cưa như vậy.