Giá trị trung bình bằng không và phương sai đơn vị về mặt dữ liệu hình ảnh là gì?


7

Tôi mới học sâu. Tôi đang cố gắng để hiểu một số khái niệm. Tôi biết "trung bình" là giá trị trung bình và "phương sai" là sai lệch so với trung bình. Tôi đã đọc một số tài liệu nghiên cứu, tất cả đều nói rằng chúng tôi xử lý trước dữ liệu của mình trước. Nhưng làm thế nào những khái niệm này có liên quan đến tiền xử lý hình ảnh? Tại sao các khái niệm này được sử dụng làm tiền xử lý dữ liệu hình ảnh?
Trên thực tế tôi không thể hiểu rằng làm thế nào các kỹ thuật này đóng góp vào phân loại. Tôi đã tìm kiếm nó trên google nhưng có thể tôi đã tìm kiếm với các từ khóa ít mô tả hơn.
Xin hãy đặt câu hỏi rất cơ bản của tôi,


1
Trên thực tế phương sai là trung bình của bình phương của sự khác biệt so với giá trị trung bình. Bạn đang hỏi về "tiêu chuẩn hóa" hay "tái định cỡ" là bước tiền xử lý? Nó được thiết kế để tránh một biến giải thích duy nhất thống trị các biến khác chỉ vì nó có một loạt các giá trị số.
Henry

Điều này thường được gọi là chuẩn hóa hình ảnh , và bạn có thể tìm thấy lý do cho nó trong liên kết.
Alex R.

1
Câu trả lời tuyệt vời cho lý do tại sao chúng ta bình thường hóa các vectơ đặc trưng, ​​từ wikipedia: "Do phạm vi giá trị của dữ liệu thô rất khác nhau, nên trong một số thuật toán học máy, các hàm mục tiêu sẽ không hoạt động chính xác nếu không chuẩn hóa. Ví dụ, phần lớn các phân loại tính toán khoảng cách giữa Hai điểm theo khoảng cách Euclide. Nếu một trong các tính năng có phạm vi giá trị rộng, khoảng cách sẽ bị chi phối bởi tính năng đặc biệt này. Do đó, phạm vi của tất cả các tính năng nên được chuẩn hóa để mỗi tính năng đóng góp tương ứng với d cuối cùng . "
Anna Vopureta

Nhận xét đó sẽ mạnh hơn nếu nó được xây dựng dựa trên cách thay đổi tỷ lệ phương sai đơn vị trung bình 0 có liên quan đến hình ảnh.
Sycorax nói Phục hồi lại

@Sycorax Hình ảnh được coi là các vectơ đặc trưng thông thường được đưa vào mô hình. Không có gì đặc biệt về hình ảnh, tất cả các tuyên bố liên quan đến chuẩn hóa đều áp dụng như nhau cho hình ảnh và các vectơ đặc trưng khác.
Anna Vopureta

Câu trả lời:


4

Đây là một câu hỏi rất hay và bạn cần hiểu điều này để hiểu thêm về học tập sâu.

Về cơ bản, bạn có hình ảnh thô, hãy chụp một hình ảnh. Hình ảnh này có 3 kênh và trong mỗi giá trị pixel của kênh nằm trong khoảng từ 0 đến 255.

Mục tiêu của chúng tôi ở đây là nén phạm vi giá trị cho tất cả các pixel trong ba kênh thành một phạm vi rất nhỏ. Đây là nơi tiền xử lý xuất hiện. Nhưng đừng nghĩ tiền xử lý chỉ liên quan đến các kỹ thuật devtn trung bình và std có nhiều thứ khác như PCA, làm trắng, v.v.

1) Sử dụng giá trị trung bình: Bằng cách tính toán giá trị trung bình, các giá trị pixel màu đỏ đầu tiên trên tất cả các hình ảnh đào tạo sẽ giúp bạn có được giá trị màu đỏ trung bình hiện diện trên tất cả các hình ảnh đào tạo ở vị trí đầu tiên. Tương tự bạn tìm thấy điều này cho tất cả các giá trị kênh màu đỏ, giá trị kênh màu xanh lá cây. Cuối cùng, bạn nhận được một hình ảnh trung bình từ tất cả các hình ảnh đào tạo.

Bây giờ nếu bạn trừ hình ảnh trung bình này khỏi tất cả các hình ảnh đào tạo, bạn rõ ràng biến đổi các giá trị pixel của hình ảnh, hình ảnh không còn có thể hiểu được bằng mắt người, các giá trị pixal hiện nằm trong phạm vi từ dương sang âm trong đó giá trị trung bình nằm ở 0 .

2) Bây giờ nếu bạn một lần nữa chia chúng cho độ lệch chuẩn, về cơ bản bạn sẽ nén phạm vi giá trị pixel trước đó thành một phạm vi nhỏ.

NHƯNG TẠI SAO TẤT CẢ ĐIỀU NÀY? Tôi sẽ nói từ kinh nghiệm của mình rằng thực hiện quá trình tiền xử lý này trên các hình ảnh và sau đó đưa các hình ảnh được chuyển đổi này vào mô hình phân loại sẽ chạy nhanh hơn và tốt hơn. Đó là lý do tại sao.

Khi bạn đang tìm hiểu sâu, hãy xem xét bình thường hóa hàng loạt sau khi bạn hiểu khái niệm chuẩn hóa này


5
Chuẩn hóa hàng loạt có liên quan đến sự thay đổi nội bộ trong phân phối và không có gì để làm những gì chúng ta đang nói.
HelloWorld

1
"Từ kinh nghiệm của tôi, mô hình chạy nhanh hơn và tốt hơn", không có vẻ thuyết phục.
Anna Vopureta
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.