Thay đổi kích thước hình ảnh và phần đệm cho CNN


13

Tôi muốn đào tạo một CNN để nhận dạng hình ảnh. Hình ảnh cho đào tạo không có kích thước cố định. Tôi muốn kích thước đầu vào cho CNN là 50x100 (chiều cao x chiều rộng), ví dụ. Khi tôi thay đổi kích thước một số hình ảnh có kích thước nhỏ (ví dụ 32x32) thành kích thước đầu vào, nội dung của hình ảnh bị kéo dài theo chiều ngang quá nhiều, nhưng đối với một số hình ảnh kích thước trung bình thì có vẻ ổn.

Phương pháp thích hợp để thay đổi kích thước hình ảnh trong khi tránh nội dung bị phá hủy là gì?

(Tôi đang suy nghĩ về việc đệm hình ảnh với 0s để hoàn thành kích thước sau khi thay đổi kích thước chúng thành một tỷ lệ giữ độ rộng và chiều cao ở mức độ nào đó. Liệu phương pháp này có ổn không?)

Câu trả lời:


9

Câu hỏi này trên stackoverflow có thể giúp bạn. Tóm lại, một số nhà nghiên cứu học sâu nghĩ rằng việc đệm một phần lớn của hình ảnh không phải là một cách thực hành tốt, vì mạng lưới thần kinh phải học rằng vùng đệm không liên quan để phân loại và không phải học nếu bạn sử dụng phép nội suy, ví dụ.


4

Bạn có một vài lựa chọn:

Đối với hình ảnh nhỏ:

  • upample thông qua nội suy
  • đệm hình ảnh bằng cách sử dụng số không

Nếu bạn không thể duy trì tỷ lệ khung hình thông qua việc lấy mẫu, bạn có thể lấy mẫu và cắt các pixel thừa ở kích thước lớn nhất. Tất nhiên điều này sẽ dẫn đến việc mất dữ liệu, nhưng bạn có thể liên tục chuyển trung tâm của cây trồng của mình. Điều này sẽ giúp mô hình của bạn mạnh mẽ hơn.


Đối với hình ảnh lớn:

  • mẫu
  • cắt giảm kích thước đầu vào của bạn

Cuối cùng, nếu bạn đang sử dụng Mạng kết hợp hoàn toàn (FCN), bạn không cần thay đổi kích thước hình ảnh của mình.

TL; DR:

có, đệm với số không là một lựa chọn hợp lệ.


Nếu tôi đã đào tạo các trọng số cho một mạng tích chập hoàn toàn chấp nhận 3 khung hình video được nối, làm cách nào tôi có thể sử dụng các trọng số này cho một mạng có cùng kiến ​​trúc ngoại trừ kích thước đầu vào được tăng lên 11 khung hình được nối? Tôi chỉ đưa ra dự đoán, không đào tạo thêm. Câu hỏi của tôi là ở đây: datascience.stackexchange.com/questions/55737/NH
mLstudent33 17/07/19

3

Bạn có thể thực hiện như sau Đầu tiên thay đổi kích thước hình ảnh đến một mức độ nhất định và sau đó đệm hình ảnh từ mọi phía, điều này có thể giúp duy trì các tính năng trong hình ảnh.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.