Tệp RAW lưu 3 màu trên mỗi pixel hoặc chỉ một?


16

Ken Rockwell nói rằng các nhà sản xuất máy ảnh xem xét các cảm biến R / G / B riêng lẻ khi họ nói về megapixel. Vì vậy, hình ảnh dưới đây sẽ là camera 6x6 pixel chứ không phải 3x3 như bạn tưởng tượng.

nhập mô tả hình ảnh ở đây

Nếu đó là sự thật, một tệp RAW sẽ chỉ chứa một thông tin màu trên mỗi pixel (có thể là R, G hoặc B) dưới dạng số 10, 12 hoặc 14 bit.

Sự nhầm lẫn của tôi xuất hiện khi tôi đọc ở một số nơi như:

  • Các tệp RAW lưu trữ một avarage của hai cảm biến màu xanh lá cây trên mỗi pixel.
  • Các tệp RAW sử dụng 12 bit cho mỗi pixel, nhưng có 3 màu nên thực sự là 36 bit cho mỗi pixel.

Điều này rõ ràng là sai, nếu tuyên bố của Ken là chính xác.

Vậy sự thật là gì?

Câu trả lời:


16

Các tệp thô không thực sự lưu trữ bất kỳ màu nào trên mỗi pixel. Họ chỉ lưu trữ một giá trị độ sáng duy nhất cho mỗi pixel.

Đúng là với mặt nạ của Bayer trên mỗi pixel, ánh sáng được lọc bằng bộ lọc Đỏ, Xanh lục hoặc Xanh lam trên mỗi pixel. Nhưng không có điểm cắt cứng nào khi chỉ có ánh sáng xanh xuyên qua pixel được lọc màu xanh lá cây hoặc chỉ có ánh sáng đỏ mới đi qua pixel được lọc màu đỏ. Có rất nhiều sự chồng chéo. Rất nhiều ánh sáng đỏ và một số ánh sáng xanh lọt qua bộ lọc màu xanh lá cây. Rất nhiều ánh sáng xanh lục và thậm chí một chút ánh sáng xanh làm cho nó xuyên qua bộ lọc màu đỏ và một số ánh sáng đỏ và xanh lục được ghi lại bằng các pixel được lọc bằng màu xanh lam.

phản ứng màu

Vì một tệp thô là một tập hợp các giá trị độ chói đơn cho mỗi pixel trên cảm biến, không có thông tin màu trên mỗi pixel thực tế cho một tệp thô. Màu sắc được lấy bằng cách so sánh các pixel liền kề được lọc cho một trong ba màu với mặt nạ của Bayer. Nhưng giống như đặt bộ lọc màu đỏ trước ống kính khi quay phim đen trắng không dẫn đến ảnh đỏ đơn sắc (hoặc ảnh B & W chỉ trong đócác vật thể màu đỏ có bất kỳ độ sáng nào), mặt nạ Bayer ở phía trước các pixel đơn sắc cũng không tạo ra màu. Những gì nó làm là thay đổi giá trị tông màu (độ sáng hoặc độ tối của giá trị độ chói của một màu cụ thể được ghi lại) của các màu khác nhau bằng các lượng khác nhau. Khi các giá trị tông màu (cường độ xám) của các pixel liền kề được lọc với ba màu khác nhau được sử dụng trong mặt nạ Bayer được so sánh thì màu sắc có thể được nội suy từ thông tin đó. Đây là quá trình chúng tôi gọi là khử khoáng .

Rất nhiều phép toán được thực hiện để gán giá trị R, G và B cho mỗi pixel. Có rất nhiều mô hình khác nhau để thực hiện phép nội suy này. Có bao nhiêu sai lệch được đưa ra cho màu đỏ, xanh lá cây và xanh lam trong quá trình khử màu là những gì thiết lập cân bằng trắng / màu . Hiệu chỉnh gamma và bất kỳ sự định hình bổ sung nào của các đường cong phản ứng ánh sáng là những gì tạo ra độ tương phản . Nhưng cuối cùng, giá trị R, G và B được gán cho mỗi pixel. Trong ví dụ về pixel 6x6 của bạn trong câu hỏi, kết quả của việc khử màu sẽ là hình ảnh 36 pixel với 36 pixel, mỗi pixel có giá trị Đỏ, Xanh lục và Xanh lam.

Một chút độ phân giải bị mất trong bản dịch. Nó chỉ ra rằng về số lượng các vạch đen và trắng xen kẽ trên mỗi inch hoặc mm có thể được giải quyết bằng cảm biến với mặt nạ RGGB của Bayer và làm rõ giới hạn độ phân giải tuyệt đối của cảm biến Bayer là khoảng 1 / √2 so với một cảm biến đơn sắc không có mặt nạ của Bayer và do đó không cần khử màu (nhưng chỉ có thể nhìn thấy trong Đen & Trắng).

Ngay cả khi máy ảnh của bạn được đặt để lưu các tệp thô, hình ảnh bạn nhìn thấy ở mặt sau màn hình LCD của máy ảnh của bạn ngay sau khi bạn chụp ảnh không phải là dữ liệu thô chưa được xử lý. Đó là hình ảnh xem trước được tạo bởi máy ảnh bằng cách áp dụng cài đặt trong camera cho dữ liệu thô dẫn đến hình ảnh xem trước jpeg bạn xem trên màn hình LCD. Hình ảnh xem trước này được thêm vào tệp thô cùng với dữ liệu từ cảm biến và thông tin EXIF ​​có chứa cài đặt trong máy ảnh tại thời điểm ảnh được chụp.

Cài đặt phát triển camera cho những thứ như cân bằng trắng, độ tương phản, bóng, nổi bật, v.v. không ảnh hưởng đến dữ liệu thực tế từ cảm biến được ghi trong tệp thô. Thay vào đó, tất cả các cài đặt đó được liệt kê trong một phần khác của tệp thô.

Khi bạn mở tệp "thô" trên máy tính, bạn sẽ thấy một trong hai điều khác nhau:

  • Hình ảnh jpeg xem trước được tạo bởi máy ảnh tại thời điểm bạn chụp ảnh. Máy ảnh đã sử dụng các cài đặt có hiệu lực khi bạn chụp ảnh và gắn nó vào dữ liệu thô trong tệp .cr2. Nếu bạn đang nhìn vào hình ảnh ở mặt sau của máy ảnh, thì đó là bản xem trước jpeg bạn đang thấy.

  • Chuyển đổi dữ liệu thô theo ứng dụng bạn đã sử dụng để mở tệp "thô". Khi bạn mở tệp 'thô' 12 bit hoặc 14 bit trong ứng dụng ảnh của mình trên máy tính, những gì bạn nhìn thấy trên màn hình là kết xuất 8 bit của tệp thô bị khử màu giống như jpeg chứ không phải jpeg tập tin 14-bit được lọc đơn sắc thực tế của Bayer. Khi bạn thay đổi cài đặt và thanh trượt, dữ liệu 'thô' được ánh xạ lại và được hiển thị lại sau 8 bit cho mỗi kênh màu.

Những gì bạn thấy sẽ phụ thuộc vào cài đặt bạn đã chọn cho ứng dụng mà bạn mở tệp thô.

Nếu bạn đang lưu ảnh ở định dạng thô khi bạn chụp, khi bạn xử lý bài đăng, bạn sẽ có cùng thông tin chính xác để làm việc bất kể cài đặt phát triển nào được chọn trong máy ảnh tại thời điểm bạn chụp. Một số ứng dụng ban đầu có thể mở tệp bằng cách sử dụng bản xem trước jpeg hoặc bằng cách áp dụng cài đặt trong máy ảnh được kích hoạt tại thời điểm hình ảnh được chụp vào dữ liệu thô nhưng bạn có thể tự do thay đổi các cài đặt đó mà không bị mất dữ liệu. bạn muốn trong bài

Digital Photo Professional của Canon sẽ mở tệp thô .cr2 theo cùng Kiểu ảnh như đã chọn trong máy ảnh khi chụp. Tất cả những gì bạn phải làm để thay đổi nó là sử dụng menu thả xuống và chọn Kiểu ảnh khác . Bạn thậm chí có thể tạo một "công thức" cho một hình ảnh và sau đó áp dụng nó cho tất cả các hình ảnh trước khi bắt đầu làm việc với chúng. Phần mềm xử lý thô của nhà sản xuất khác cũng tương tự và thường có tùy chọn để ứng dụng mở hình ảnh với cài đặt phát triển camera được áp dụng.

Với các ứng dụng xử lý thô của bên thứ ba như Lightroom của Adobe hoặc Camera Raw , Aperture hoặc Photos của Apple , Capture One Pro của PhaseOne , OpticsPro của DxO Lab , v.v., để hình ảnh hiển thị theo cài đặt camera có thể khó hơn một chút. Chẳng hạn, các sản phẩm Adobe bỏ qua hầu hết tất cả phần ghi chú của nhà sản xuất dữ liệu EXIF ​​của tệp thô trong đó nhiều nhà sản xuất bao gồm ít nhất một số thông tin về cài đặt camera.

Màu sắc thực tế của mặt nạ Bayer trước các cảm biến của hầu hết các máy ảnh kỹ thuật số màu là: Màu xanh lam - một phiên bản màu hơi tím của màu xanh lam ở giữa 450 nanomet, Màu xanh lá cây - một phiên bản màu hơi xanh của trung tâm khoảng 540 nanomet và Màu đỏ - một phiên bản màu cam hơi vàng. Cái mà chúng ta gọi là "màu đỏ" là màu sắc chúng ta cảm nhận được đối với ánh sáng ở bước sóng khoảng 640 nanomet. Các bộ lọc "màu đỏ" trên hầu hết các mảng của Bayer cho phép ánh sáng xuyên qua ở một nơi nào đó khoảng 590-600 nanomet. Sự chồng chéo giữa các hình nón "xanh" và "đỏ" trong võng mạc của con người thậm chí còn gần hơn thế, với "màu đỏ" tập trung ở khoảng 565 nanomet, đó là những gì chúng ta cho là màu xanh lá cây màu vàng.


1
Điều này về cơ bản là không chính xác. Bạn nói (hoặc ít nhất là rất mạnh mẽ ngụ ý) rằng điều này hoạt động vì thông tin màu bị rò rỉ vào hàng xóm. Nó không cần thiết. Nguyên sẽ hoạt động tốt nếu các bộ lọc sẽ hoàn toàn tuyệt vời. Các thuật toán khử màu khác nhau "liên quan đến rất nhiều toán học", nhưng cách đơn giản nhất là chỉ lấy trung bình các pixel gần đó và điều này hoạt động tốt một cách đáng ngạc nhiên. Tôi đoán đã thực hiện vài triệu lần trong một hình ảnh nhiều megapixel về mặt kỹ thuật là "rất nhiều" toán học, nhưng nó không phải là toán học phức tạp - đó là thứ cấp ba.
mattdm

2
Bayer hoạt động vì nhìn chung, một dự đoán tốt là pixel tại một vị trí được lọc màu xanh lam có cùng lượng màu xanh lá cây với các pixel màu xanh lá cây bên cạnh nó (và tương tự với màu đỏ). Khi dự đoán này bị tắt, bạn sẽ nhận được các tạo phẩm và đó là những gì các thuật toán phức tạp hơn cố gắng giải quyết. Họ không làm việc bằng cách giả định kiến ​​thức đặc biệt về đáp ứng tần số của các bộ lọc.
mattdm

1
Tôi có thể đã hiểu nhầm những gì bạn đã nói suốt từ đó, vì bạn thường xuyên nêu ra điều này. :) Đặc biệt là khi bạn mở câu trả lời với nó, bạn có thể chỉnh sửa để giải thích theo cách làm cho nó rõ ràng hơn không? Đặc biệt, bạn có nghĩa là các bộ lọc chồng chéo có nghĩa là kết quả về cơ bản là không chính xác cho dù xử lý được thực hiện và chúng ta chỉ sống với điều đó, hoặc nó có thể được thực hiện chính xác bằng một số biến đổi trong việc khử nhiễu, hoặc nó có thể được thực hiện chính xác hơn bằng cách một bước nữa mà kết xuất tệp RAW yêu cầu (nhưng đó không phải là một phần của việc phá hủy)?
mattdm

1
Tôi chỉ có nghĩa là quá nhiều người mô tả mặt nạ Bayer không chính xác vì chỉ cho phép ánh sáng xanh qua bộ lọc màu xanh lá cây, chỉ cho phép ánh sáng đỏ qua bộ lọc màu đỏ và chỉ cho phép ánh sáng xanh qua bộ lọc màu xanh. Điều đó không hơn gì khi nói rằng bằng cách sử dụng bộ lọc màu xanh lá cây với phim B & W sẽ chỉ cho phép ánh sáng xanh trong cảnh được chụp. Sử dụng bộ lọc màu xanh lá cây chỉ có nghĩa là ánh sáng xanh được cho phép xuyên qua với tốc độ truyền cao hơn so với ánh sáng đỏ hoặc xanh lam, nhưng một số trong cả ba đều đi qua. Chỉ bằng cách so sánh sự khác biệt giữa ánh sáng ...
Michael C

1
@mattdm tính trung bình các pixel gần đó tạo ra một bức ảnh rất mờ và không có máy ảnh nào trên thị trường thực hiện theo cách đó. Các thuật toán khử màu lợi dụng sự tương quan giữa các pixel RGB để cải thiện đáng kể độ phân giải, với chi phí của tạo tác không thường xuyên. Và chắc chắn có liên quan đến toán học nặng.
Đánh dấu tiền chuộc

2

Tất cả đều đúng, nhưng việc giải thích có thể được kéo dài.

Mẫu màu thô cụ thể đó được gọi là mẫu của Bayer.

Có, raw là một màu trên mỗi pixel và một pixel đó (thường là) 12 bit. Vì vậy, có ba màu của pixel thô, một số là màu xanh lam, một số là màu đỏ và gấp 2 lần số đó là màu xanh lá cây.

Sau đó, phần mềm xử lý thô (để tạo RGB JPG, có thể ngay lập tức trong máy ảnh hoặc có thể ở bên ngoài nhiều sau này) chuyển đổi dữ liệu thô thành hình ảnh RGB để chúng ta có thể sử dụng nó. Đây là phép nội suy, các pixel lân cận của hai màu còn lại được kết hợp thành từng pixel RGB này, nhưng tất cả đều trở thành pixel RGB. Tại thời điểm đó, nó là các pixel RGB 36 bit, tuy nhiên độ phân giải không gian bị tổn hại đôi chút, với các dữ liệu pixel khác nhau được chia sẻ với hàng xóm. Chúng tôi có thể kết thúc với (ví dụ) 6000 pixel RGB chiều rộng cảm biến, nhưng nó đến từ 2000 cảm biến màu xanh lam và 2000 màu đỏ, v.v. (và dữ liệu cũng được chia sẻ theo chiều dọc, nó đến từ hơn ba pixel). Điều này được gọi là khử màu ... có thể được tìm thấy trực tuyến.


IMHO thường là 14 bit. Chỉ các máy ảnh cũ (ví dụ Canon S120) lưu trữ 12 bit mỗi pixel
Romeo Ninov

@RomeoNinov, nó không đơn giản như cũ so với mới. Ví dụ: một số Nikons cho phép bạn chọn 12 bit hoặc 14 bit, do đó bạn có thể cân bằng độ sâu hình ảnh so với tốc độ chụp liên tục và kích thước hình ảnh.
Peter Taylor

@PeterTaylor, không bao giờ biết điều này, tôi là game bắn súng của Canon. Nhưng điều này đối với tôi như ngoại lệ, không thích quy tắc (12 bit). Và theo như tôi nhớ, một số máy ảnh lưu trữ 16 bit mỗi pixel
Romeo Ninov

Sẽ là một cuộc tranh luận mạnh mẽ hơn nhiều nếu bạn cung cấp bất kỳ bằng chứng nào về hầu hết các máy ảnh Canon là 14 bit. Đây là cách nói khác của Canon: cpn.canon-europe.com/content/education/infobank/ triệt "Hầu hết các máy ảnh kỹ thuật số của EOS chụp ảnh ở chế độ 12 bit"
WayneF

@WayneF Dựa trên máy ảnh được tham chiếu là tốt nhất của Canon tại thời điểm đó (1D Mark II), bài viết đó được viết vào khoảng giữa tháng 4 năm 2004 (khi 1D II thay thế 1D) và tháng 6 năm 2005 (khi 1D Mark IIN thay thế 1D II) .
Michael C

2

Ken là đúng trong yêu cầu bạn trích dẫn - loại. Đúng là máy ảnh kỹ thuật số ngày nay (ngoại trừ những máy ảnh có cảm biến Foveon của Sigma) hoạt động bằng cách sử dụng ma trận Bayer và độ phân giải cảm biến được trích dẫn là kích thước của ma trận. Hình ảnh ví dụ của bạn đại diện cho cảm biến "36 pixel". Tuy nhiên, điều quan trọng là phải nhận ra rằng các máy ảnh biến điều này thành một hình ảnh đầy đủ màu sắc với kích thước được chỉ định đầy đủ trong các pixel thực tế và điều này không tệ như Ken đưa ra .

Một số điều ông nói trong bài báo đó là hết sức sai lầm, bắt đầu bằng:

Kể từ năm 2006, các thuật toán thông minh này cho phép bắt đầu với một phần ba dữ liệu và làm cho nó trông đẹp như có một nửa số pixel được yêu cầu.

Điều này là vô nghĩa trong năm 2006 và ngày nay là vô nghĩa. Quá trình này hoạt động trên một số giả định đơn giản. Nhiều trong số đó được trình bày ở đây , nhưng điều cơ bản là bạn có thể dự đoán thông tin "thiếu" sẽ nhìn vào các pixel lân cận có màu khác nhau. Điều này hóa ra là một giả định tốt hầu hết thời gian, và rất sai thời điểm khác. Trong trường hợp không có nhiều chuyển đổi rất chi tiết giữa các màu, kết quả sẽ tốt như thể mỗi giác quan được ghi lại đầy đủ màu sắc. Trong trường hợp giả định sai, nó tồi tệ hơn nhiều. Trong thế giới thực, trước đây thực sự rất phổ biến và hoạt động tốt hơn nhiều so với "một nửa" - nhưng điều quan trọng là nó phụ thuộc vào ngữ cảnh.

RAW không cung cấp lợi thế ở đây, ngoại trừ một canh bạc tiềm năng. Nội suy của Bayer diễn ra trong phần mềm mở dữ liệu thô. Những tiến bộ trong tương lai của thuật toán nội suy của Bayer có thể được tích hợp trong phần mềm thô trong tương lai, nếu và chỉ khi nhà sản xuất máy ảnh của bạn tiếp tục hỗ trợ máy ảnh của ngày hôm qua trong phần mềm của ngày mai. Cũng giống như, nhà sản xuất máy ảnh của bạn có thể không còn hỗ trợ máy ảnh cũ của bạn trong phần mềm thô của ngày mai!

Anh ta đúng khi chụp RAW không thay đổi các nguyên tắc cơ bản, nhưng ý tưởng cho rằng các tệp cũ sẽ ngừng hoạt động về cơ bảnvô nghĩa . Vì các máy ảnh cũ sử dụng cùng một nguyên tắc cơ bản và các định dạng tệp tương tự về cơ bản, nên sẽ không tốn nhiều chi phí để mang lại sự hỗ trợ cho các mẫu cũ và các nhà cung cấp có rất nhiều động lực để làm điều đó - và ngay cả khi điều đó sẽ xảy ra, vẫn rất tuyệt bộ giải mã nguồn mở.

Và tất nhiên, việc giữ các tệp RAW cung cấp các lợi thế khác không liên quan đến việc khử màu.

Nhưng cũng thật ngớ ngẩn khi nói rằng khả năng cải tiến trong tương lai là lợi thế duy nhất . Như tôi đã nói, có những giả định khác nhau có thể được đưa ra về nội dung hình ảnh của bạn và các thuật toán khác nhau (hoặc điều chỉnh các thuật toán đó) sẽ phù hợp hơn với các tình huống trong thế giới thực khác, vì vậy nếu bạn thấy mình trong tình huống bạn đang gặp phải moire hoặc các đồ tạo tác khác, bạn có thể đối phó với điều đó. (Mặc dù, tôi nên nói thêm rằng điều này ở mức rất phức tạp - rất hiếm khi có một tình huống nhìn trộm điều này chặt chẽ là đáng giá.)

Ngoài ra còn có một yếu tố mà Ken có thể được bào chữa vì bài báo này đã có một thập kỷ. Trong năm 2006, hầu hết các máy ảnh đều nằm trong phạm vi 5-8 megapixel, với các mẫu DSLR cao cấp kéo dài đến 12. Bây giờ, các máy ảnh DSLR tầm trung / thấp và máy ảnh không gương lật cung cấp 16 và 24 megapixel, và nó đi lên từ đó. Tại thời điểm này, việc ngụy biện về chi tiết màu sắc ở cấp độ nhìn trộm pixel thực sự mang tính học thuật, bởi vì trong thế giới thực, rất hiếm khi ánh sáng, ống kính, độ ổn định và mọi thứ khác xếp thành hàng sao cho đây là yếu tố hạn chế.

Nói chung, rất nhiều trang web của Ken Rockwell là như thế này. (Xem câu trả lời này để biết thêm .) Điều này thật đáng tiếc, vì anh ta thực sự có rất nhiều điều thú vị để nói và một số lời khuyên tốt, nhưng cũng có rất nhiều điều vô nghĩa, và thay vì thừa nhận rằng hoặc cải thiện nó, anh ta có xu hướng tăng gấp đôi xuống, và sau đó tuyên bố rằng toàn bộ trang web là châm biếm.

Ồ, và một sự thật thú vị: màn hình LCD phía sau máy ảnh và EVF cũng sử dụng ba pixel phụ màu để thể hiện một pixel kỹ thuật số và những màn hình này thường được bán trên thị trường với số lượng pixel phụ - hiệu quả là 3 × những gì bạn có thể mong đợi từ cách phân giải màn hình máy tính được đưa ra.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.