Hiểu các thành phần Cb và Cr của không gian màu YCbCr


11

Tôi quen thuộc với các không gian màu phụ gia (RGB), trừ (CMYK) và HSV, nhưng một bài viết tôi hiện đang cố gắng hiểu hoạt động trên không gian màu YCbCr để phân định hình ảnh / đối tượng.

Tôi đã dành phần lớn buổi sáng của mình để tìm kiếm thứ gì đó sẽ giải thích YCbCr một cách tự nhiên, nhưng tôi không hiểu. Tôi đã có một lời giải thích trực quan, thú vị về ý tưởng chung đằng sau không gian màu này ở đây và giải thích về cách nó được sử dụng để mã hóa / nén hình ảnh từ những người này (tất cả trên photo.SE).

Các công thức để tính toán YCbCr từ RGB có thể truy cập dễ dàng trên wikipedia .

Tôi đã có động lực cho đại diện này, tôi đã nhận được rằng thành phần Y chứa thông tin quy mô màu xám quan trọng nhất (đối với mắt người) về hình ảnh.

Tôi đã nhận được rằng Cb và Cr mang thông tin về màu sắc , và rằng (vì tính nhạy cảm của mắt người), chúng có thể được nén mà không bị giảm chất lượng. Nhưng, mỗi thành phần sắc độ thực sự đại diện cho cái gì?

Như các tác giả bài báo đề cập rằng "thông tin sắc độ là tối quan trọng trong định nghĩa của các đối tượng" trong cách tiếp cận của họ và tôi không thể hiểu đầy đủ những gì tôi đang đọc với mức độ "Y là cường độ, Cb và Cr mang thông tin màu nào đó" hiểu YCbCr.

Tôi đang tìm kiếm câu trả lời dọc theo dòng "Cb là ..., trong khi Cr là ..." hoặc "nếu bạn tưởng tượng nhìn qua / với XY, bạn thực sự đang nhìn vào thành phần Cb ..." hoặc một số một cách khác có thể giúp tôi hiểu thông tin được mang theo bởi từng thành phần riêng biệt, không chỉ là chúng cùng nhau mang thông tin màu.

BIÊN TẬP

Hãy để tôi đưa ra ví dụ về giải thích trực quan cho các không gian màu khác thuộc loại tôi đang tìm kiếm:

RGB : Giống như chiếu đèn pin màu trên tường màu đen: Nếu bạn tỏa sáng bằng đèn pin màu xanh, bạn sẽ thấy hình phản chiếu màu xanh. Nếu bạn thêm đèn pin màu đỏ, nó sẽ hiển thị hình phản chiếu màu đỏ tươi, là hỗn hợp của màu xanh và đỏ.

CMYK : Giống như trộn màu nước, bạn "thêm vào màu sắc bề mặt phản chiếu", (nghĩa là trừ màu khỏi nền), vì vậy nếu bạn trộn màu vàng với màu lục lam, nếu sẽ phản chiếu màu xanh lục và do đó bạn sẽ có màu xanh lục.

HSV : Trẻ nhỏ bị thu hút bởi các vật thể bão hòa cao, không sáng (giá trị). Thành phần Hue là thứ "cho màu", trong khi độ bão hòa thấp có nghĩa là màu bị "pha loãng" bởi màu trắng. Thay đổi giá trị làm cho toàn bộ điều sáng hơn hoặc tối hơn.

Với định nghĩa này, tôi đã có thể có được cảm giác trực quan về việc thể hiện màu sắc trong mỗi không gian màu có nghĩa là gì, mà không cần ghi nhớ biểu đồ cho từng loại.

Câu trả lời:


7

YUV (hoặc YCbCr) giống như HSV, nhưng ở các tọa độ khác nhau. (Sự khác biệt giữa YUV và YCbCr là cận biên - chủ yếu liên quan đến các công thức chính xác).

V(S,H)(U,V)HS

U=Scos(H)

V=Ssin(H)

Bạn có thể xem liên kết này để biết thêm thông tin.

Một điều khác để thêm vào danh sách trực giác của bạn:

Độ bão hòa là màu sắc tinh khiết như thế nào từ quan điểm quang phổ . Ví dụ, laser có phổ rất hẹp, hàm ý độ bão hòa cao.


bạn có thể thêm lời giải thích về sự khác biệt giữa YUV và YCbCr, vì mục đích hoàn chỉnh không?
Penelope

@Andrey Rubshtein, Nếu laser có độ bão hòa cao, điều ngược lại có đúng không? Nói cách khác, nếu tôi đo RGB và chuyển đổi sang HSV, độ bão hòa cao có nghĩa là nó phải bắt nguồn từ nguồn laser kết hợp không? Cảm ơn bạn.
Frank

@Frank, không nhất thiết phải là laser. Nhưng thật khó để có một màu bão hòa với phổ rộng, vì nó càng rộng thì càng khó có phản ứng cao chỉ trong một thành phần.
Andrey Rubshtein

@Andrey Rubshtein, Cảm ơn câu trả lời của bạn. Đơn vị mks của Cường độ bão hòa là năng lượng trên một đơn vị thời gian trên một đơn vị diện tích. . Các đơn vị mks của sự lưu loát năng lượng bão hòa là năng lượng trên một đơn vị diện tích. trong đó các xung laser trạng thái rắn dài, 10 đến 50 ns (nano giây). Độ bão hòa cao với phổ rất hẹp ngụ ý rằng nó phải bắt nguồn từ nguồn laser kết hợp?
Frank

@Andrey Rubshein. Bạn hoàn toàn chính xác..Tôi vừa phát hiện ra rằng đèn LED phát ra ánh sáng khá đơn sắc, cũng như đèn natri áp suất thấp. Có những đặc điểm khác biệt của con trỏ laser kết hợp mà người ta có thể sử dụng để phân biệt các tia con trỏ laser ngoài hình ảnh tổng thể quan sát được qua cửa sổ buồng lái máy bay Boeing 737 không?
Frank

2

Không chắc chắn ý của bạn là "thực sự" đại diện cho điều gì, vì cả RGB và YUV đều không đại diện cho tần số photon hoặc phản ứng hình nón / hình nón điển hình của con người. Nhưng bạn có thể thấy chúng trông như thế nào với bạn bằng cách tổng hợp một số bản vá màu YCrCb, chẳng hạn như (1,1,0), (1, -1,0), (1,0,1), (1,0, - 1), v.v.

Đây là một trang Wikipedia bao gồm một biểu đồ:

http://en.wikipedia.org/wiki/File:YCbCr-CbCr_Scaled_Y50.png

THÊM: RGB, và như vậy, gần như được thiết kế (hoặc phát triển) để phù hợp với sự hiểu biết trực quan có thể có của con người về nhận thức (và tên màu hóa ra được học theo văn hóa). YUV thì ngược lại, được thiết kế sao cho nhiễu ở vùng UV (được thêm vào băng con NTSC ồn ào) sẽ khó nhìn thấy và do đó khó diễn tả hơn. YCrCb là một biến thể trên cùng một ánh xạ màu. Vì vậy, đừng tìm kiếm một cái nhìn sâu sắc "trực quan" hiện có, có thể không tồn tại. Có lẽ tạo riêng của bạn bằng cách "học" biểu đồ và xây dựng một số kết nối thần kinh hoàn toàn mới có thể không tồn tại trong não của bạn (hoặc một cái gì đó tương tự.)


Tôi đã thêm các ví dụ cho các không gian màu khác thuộc loại tôi muốn nhận cho YCbCr. Hy vọng điều này làm cho loại giải thích tôi đang tìm kiếm rõ ràng hơn.
Penelope

0

Khi bạn hiểu HSV / HSB, không khó để hiểu YCbCr. Kênh B trong HSB tương ứng với sắc độ (chroma = saturation http://vident.com/products/shade-manloyment/color-theory/under Hiểu-color-overview / hue-value-and-chroma /). Bạn có thể lấy hình ảnh rgb và chuyển đổi nó thành thang độ xám hoặc bạn có thể chuyển đổi mọi kênh của RGB sang thang độ xám và chúng hợp nhất chúng thành một kênh. Để đơn giản hóa, hãy có pixel với 100% đỏ, 100% xanh lục và 70% xanh lam. Bạn sẽ tính trung bình ... (100 + 100 + 70) / 3 và bạn nhận được giá trị 90%, có nghĩa là 90% độ sáng. Vì vậy, trong thang độ xám, nó có màu xám rất nhạt. Bây giờ, nếu chúng ta muốn thể hiện màu gốc đối với kênh thang độ xám, chúng ta sẽ cần 3 công thức cho mỗi màu (đỏ, lục, lam). Bạn sẽ tính chênh lệch giá trị R so với thang độ xám, G so với thang độ xám và B so với thang độ xám. Điều này sẽ cần 4 kênh (RGB + sắc độ). Nhưng chúng ta có thể làm tương tự với 3 kênh. Chúng tôi có thể điều chỉnh nhỏ cho kênh màu xanh lá cây. Hãy tính toán sự khác biệt với kênh màu xanh lá cây. Màu xanh lá cây nguyên bản là 100%, giá trị mới của màu xanh chuyển thành màu xám là 90%. Chênh lệch là -10%. Vì vậy, hãy thay đổi kênh R và B của pixel này bằng sự khác biệt này. Chúng tôi chỉ sửa gamma hoặc tất cả các kênh. Giá trị kênh màu xanh lá cây sẽ giống như đối với hình ảnh thang độ xám. Vì vậy, chúng tôi không tính toán với kênh xanh nữa. Màu xanh lá cây được "mã hóa" trong kênh màu sắc Y ... Phần còn lại của màu sắc (R, B), cũng được điều chỉnh. R` = 90% gốc hoặc 100% Y vì R và B bằng nhau trong ví dụ này. Hợp chất B có sự khác biệt + 20% so với ban đầu, nhưng sau khi được thay đổi bằng hiệu chỉnh gamma, nó có sự khác biệt + 30% đối với Y. Để đơn giản hóa hơn nữa, nó giống như công thức mà bạn cần bổ sung cho cả ba hợp chất. Sự khác biệt mà bạn nhận được cho màu đỏ và màu xanh là Cb và Cr. Các nhân vật chỉ nói rằng bạn đã so sánh kênh Blue với kênh sắc độ và kênh Red với kênh Chromma. Do đó Cb và Cr.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.