Tầm nhìn máy tính: Tại sao các bộ lọc ngẫu nhiên thực hiện tương tự như máy dò cạnh?


7

Tôi đọc ở đây rằng "một bộ lọc khởi tạo ngẫu nhiên hoạt động rất giống như một máy dò cạnh!". Tôi muốn biết nếu có bất kỳ giấy tờ nào mô tả và giải thích hiện tượng này.


Bạn chỉ quan tâm đến giấy hoặc giải thích hợp lý sẽ đủ? Bởi vì bộ lọc nhân trong cách sử dụng như vậy thực sự là máy dò cạnh, nhưng "hiện tượng" như bạn gọi nó chỉ là "chọn góc cho máy dò của tôi một cách đồng đều" nên bất kỳ sự gián đoạn nào ở các góc đã cho sẽ được phát hiện - nếu chúng không phải là tất cả 0.
Ác

Vì bạn đang tìm kiếm giấy tờ - tôi chỉ khuyến khích bạn đọc cách phát hiện cạnh - chúng được tính cho các góc đã cho, nhưng nếu bạn không quan tâm nhiều đến bất kỳ góc cụ thể nào, nhưng một khi đã chọn bạn hãy sử dụng chúng một cách nhất quán để cung cấp cho mạng của bạn , hầu hết mọi số thống nhất đều tốt (trường hợp không, trường hợp nhận dạng và trường hợp mắt bị thoái hóa nên được loại bỏ). Khi bạn lấy bộ lọc để cung cấp thứ gì đó, nó thậm chí không phải được chuẩn hóa.
Ác

Câu trả lời:


7

Trực giác, cho một trường hợp nhỏ

Tại sao? Hãy xem xét trường hợp đơn giản nhất có thể, trong đó hạt nhân là 1x2 (nghĩa là rộng hai pixel và cao một pixel).

Đây là một ma trận hạt nhân cho một máy dò cạnh phát hiện các cạnh dọc:

E1= =[-1+1]

Đây là một ma trận khác cho một máy dò cạnh cũng phát hiện các cạnh dọc:

E2= =[+1-1]

Đặc biệt, tích chập với E1 phản ứng mạnh với các cạnh thẳng đứng và ở đó cạnh phải của cường độ cao hơn và cạnh trái có cường độ thấp hơn (trắng hơn ở bên phải, đen hơn ở bên trái). E2 phản ứng mạnh mẽ với các cạnh thẳng đứng với sự thay đổi cường độ ngược lại (trắng hơn ở bên trái, đen hơn ở bên phải).

Chúng ta có thể thấy rằng điều tương tự cũng đúng với các ví dụ khác. Ví dụ, xem xét

E3= =[+1.7-1.7]

Điều này hành xử gần như giống hệt với E2, ngoại trừ việc thay đổi kích thước ở đầu ra của nó.

Để đơn giản, hãy tập trung vào các hạt tích chập đã được chuẩn hóa để các mục nhập của chúng bằng không. (Nhiều hạt nhân chập mà chúng ta sử dụng trong thực tế có dạng này, bởi vì chúng có các đặc tính tốt.)

Điều gì về một ma trận 1x2 ngẫu nhiên? Chà, nếu nó đã được chuẩn hóa, thì nó nhất thiết phải có dạng

M= =[+α-α]

cho một số hằng α (Ở đâu αlà ngẫu nhiên). Bất kể điều gìα là, chúng ta thấy rằng điều này hành xử giống như E1 hoặc là E2.

Kết luận: bộ lọc tích chập 1x2 ngẫu nhiên, chuẩn hóa hoạt động giống như một máy dò cạnh dọc, với xác suất cao.

Trường hợp lớn hơn

Điều này có thể được khái quát cho các kích thước khác của hạt nhân. Đối với hạt nhân 2x1 ngẫu nhiên, được chuẩn hóa, về cơ bản chúng ta sẽ có một bộ phát hiện cạnh ngang. Một hạt nhân 2x2 ngẫu nhiên, được chuẩn hóa sẽ có khả năng đáp ứng các cạnh theo một số hướng (có thể ở một góc nào đó; hướng cụ thể sẽ phụ thuộc vào các mục của ma trận).

Khi ma trận ngày càng lớn hơn, hiệu ứng này giảm dần (tôi nghĩ). Tuy nhiên, thông thường trong thực tế, chúng tôi sử dụng hạt nhân chập tương đối nhỏ (một lĩnh vực tiếp nhận khá nhỏ), vì vậy chúng tôi thực sự quan tâm chủ yếu về hành vi với các hạt tích chập nhỏ.

Bình thường hóa

Bình thường hóa thì sao? Cho đến nay tôi đã nói về ma trận được tạo ngẫu nhiên và sau đó được chuẩn hóa thành tổng bằng không. Nếu chúng ta bỏ qua bước chuẩn hóa thì sao?

Chà, điều này không thay đổi nhiều lắm. Không bình thường hóa, mộtm×n ma trận ngẫu nhiên M có thể bị phân hủy thành M= =M'+cMột Ở đâu M' được chuẩn hóa để các mục nhập của nó tổng bằng không, c là một hằng số Một là ma trận chứa 1/(mn) trong mỗi mục.

Kết hợp hình ảnh đầu vào với M'về cơ bản có khả năng áp dụng bộ lọc dò cạnh cho hình ảnh đầu vào (như đã thảo luận ở trên). Kết hợp hình ảnh đầu vào vớicMột về cơ bản sẽ làm mờ hình ảnh và sau đó nhân lên c. Do đó, hình ảnh đầu ra là tổng (có trọng số) của hai loại này: tổng (có trọng số) của bộ lọc máy dò cạnh cộng với phiên bản mờ của hình ảnh.

Đối với một ma trận ngẫu nhiên, có một cơ hội tốt c sẽ tương đối nhỏ (vì giá trị trung bình của tổng số các biến ngẫu nhiên thường khá nhỏ), do đó nhân với clàm cho hình ảnh đầu ra được xác định nhiều hơn bởi bộ dò cạnh hơn là làm mờ. Nếuc là nhỏ, về cơ bản chúng ta có thể bỏ qua số hạng thứ hai của tổng và xấp xỉ hình ảnh đầu ra là kết quả của bộ lọc máy dò cạnh.

Đó là lý do tại sao tích chập với ma trận ngẫu nhiên có cơ hội tốt giống như áp dụng một loại máy dò cạnh nào đó cho hình ảnh đầu vào.

Nhìn vào các hình ảnh ví dụ trên các trang đó, trong mắt tôi, cái đầu tiên trông ít nhiều giống như một máy dò cạnh, và cái thứ hai trông ít nhiều giống như một toán tử mờ. Điều này phù hợp với các phân tích ở trên.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.