Bán kính tối ưu của phân phối gaussian để xác định màu pixel là gì?


10

Sử dụng phân bố điểm gaussian trên mặt phẳng hình ảnh để tính giá trị pixel, bán kính / độ lệch chuẩn nào sẽ cung cấp nhiều thông tin nhất trong hình ảnh cuối cùng? Bán kính quá lớn cho hình ảnh bị mờ và bán kính quá nhỏ sẽ bỏ qua thông tin nhỏ hơn pixel để không đóng góp vào hình ảnh cuối cùng. Đâu là sự thỏa hiệp tối ưu? Có một câu trả lời duy nhất cho câu hỏi này hoặc có những trường hợp mà nó có thể thay đổi?

Tôi đang nghĩ về điều này liên quan đến raytracing nhưng tôi tưởng tượng nó sẽ áp dụng như nhau cho những thứ như thu nhỏ hình ảnh. Trường hợp các câu trả lời sẽ khác nhau, tôi quan tâm đến những gì áp dụng khi lấy mẫu mặt phẳng hình ảnh liên tục, để có thể sử dụng vị trí của các pixel trong một hình ảnh lớn hơn để xác định bán kính tối ưu.

Câu trả lời:


7

Tôi không chắc chắn rằng có một bán kính thực sự tối ưu , nó sẽ là một vấn đề chủ quan dựa trên hình ảnh trông như thế nào. Như bạn nói, bán kính quá lớn dẫn đến mờ và bán kính quá nhỏ dẫn đến răng cưa.

Tôi thích đặt sigma = 0,5 px, để bán kính tổng thể khoảng 1,5 px (vì Gaussian có phần lớn trọng lượng của nó trong phạm vi ± 3 sigma của giá trị trung bình của nó). Theo kinh nghiệm của tôi, điều đó mang lại sự đánh đổi tốt giữa làm mờ và khử răng cưa, nhưng đó chỉ là sở thích của tôi, không dựa trên bất kỳ cân nhắc khách quan nào.

Nhân tiện, như một phần của một bài đăng trên blog về khử răng cưa tôi đã viết năm ngoái (dựa trên câu trả lời tôi đã đăng trên trang web trước đây của trang web này!), Tôi đã thử nghiệm nhiều loại hạt nhân khử răng cưa với hình ảnh thử nghiệm tổng hợp và đưa ra với Gaussian 0,5 px là yêu thích chủ quan của tôi.


Tôi nhớ câu trả lời đó lần trước :) (lúc đó tôi đã bị githubphagocyte). Thật thú vị khi thấy nó được mở rộng thành một bài đăng trên blog.
trichoplax

4

Hãy tưởng tượng rằng người ta đang vẽ một bức tranh của một sàn phẳng với một mẫu bàn cờ trắng đen đồng nhất kéo dài đến tận chân trời; các rô-bốt đủ lớn để có thể nhìn thấy rõ tại các điểm gần máy ảnh nhưng không đủ lớn để có thể phân biệt gần đường chân trời.

Gần đường chân trời, sàn nhà đơn giản sẽ xuất hiện dưới dạng màu xám đồng nhất. Gần camera, người kiểm tra sẽ xuất hiện khác biệt. Giữa máy ảnh và đường chân trời, sự xuất hiện của sàn nhà bằng cách nào đó phải chuyển đổi giữa hai thái cực đó.

Nếu cảnh được hiển thị một bộ lọc không gian có phần bị cắt rất cừu, sẽ có một khoảng cách nhất định mà sàn nhà chuyển từ màu ca rô sang màu xám. Nếu một người sử dụng bộ lọc nông hơn, quá trình chuyển đổi sẽ dần dần hơn nhiều, nhưng những thứ ở gần khoảng cách "cắt" ban đầu sẽ kém sắc hơn so với trước đây.

Nếu người ta thêm một "bức tường" hoặc cắt cảnh để che giấu các phần xa của sàn nhà, do đó không cần phải có bất kỳ phần nào của sàn ca rô bị mờ thành màu xám, kết quả tốt nhất sẽ đạt được bằng cách sử dụng dốc nhất bộ lọc, mang lại hình ảnh sắc nét nhất. Sử dụng bộ lọc nông hơn sẽ từ bỏ độ sắc nét của hình ảnh cho mục đích ngăn chặn quá trình chuyển đổi khó chịu dù sao sẽ không nhìn thấy được.

Do đó, việc tìm ra loại lọc nào sẽ sử dụng đòi hỏi người ta phải biết điều gì đó về nội dung tần số không gian của thông tin sẽ được hiển thị. Nếu hình ảnh không có gì đáng quan tâm sẽ tiếp cận Nyquist, sử dụng bộ lọc dốc sẽ tạo ra kết quả sắc nét nhất. Tuy nhiên, nếu nội dung hình ảnh vượt quá Nyquist, sử dụng bộ lọc dần dần sẽ tránh được các "chuyển đổi" xấu xí. Không có cách tiếp cận duy nhất sẽ là tối ưu cho tất cả các trường hợp.


2

Theo quan điểm và kinh nghiệm của tôi, tôi không nghĩ rằng có tồn tại một câu trả lời không chính đáng ... vì về cơ bản trong văn học, bạn cũng có thể dễ dàng tìm thấy ví dụ về các bộ lọc thích ứng (ví dụ về kích thước thay đổi).

Tôi nghĩ rằng câu trả lời thực tế nên liên quan đến cả bối cảnh của các ứng dụng (ví dụ như phần cứng hoặc phần mềm, thời gian thực hay không) và loại cảnh bạn sẽ tổng hợp (một số cảnh thường liên quan đến loại răng cưa khác nhau khi được tổng hợp (tôi sử dụng thuật ngữ chung này về mục đích)). Về cơ bản đồ họa máy tính là nghiên cứu các thuật toán và cấu trúc dữ liệu để tổng hợp hình ảnh và định nghĩa như vậy không liên quan chặt chẽ đến bất kỳ loại ứng dụng nào.

Tất nhiên, một yếu tố quan trọng thậm chí là mục tiêu cần đạt được bằng một quá trình lọc (nghĩa là không cần thiết làm mờ quá mức có thể là xấu ...).

Nếu bạn đang nói về "tốt để xem" tôi nghĩ bạn có thể đồng ý với tôi khi tôi nói rằng không có thước đo cụ thể về "hình ảnh dễ chịu".

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.