Tôi đang đối mặt với vấn đề có hình ảnh có kích thước khác nhau làm đầu vào trong một nhiệm vụ phân đoạn. Lưu ý rằng hình ảnh thậm chí không có cùng tỷ lệ khung hình.
Một cách tiếp cận phổ biến mà tôi thấy nói chung trong học tập sâu là cắt xén hình ảnh, vì nó cũng được đề xuất ở đây . Tuy nhiên, trong trường hợp của tôi, tôi không thể cắt hình ảnh và giữ trung tâm của nó hoặc một cái gì đó tương tự vì trong phân đoạn tôi muốn đầu ra có cùng kích thước với đầu vào.
Bài viết này cho thấy rằng trong một nhiệm vụ phân đoạn, người ta có thể cung cấp cùng một hình ảnh nhiều lần cho mạng nhưng với một tỷ lệ khác nhau và sau đó tổng hợp các kết quả. Nếu tôi hiểu chính xác phương pháp này, nó sẽ chỉ hoạt động nếu tất cả các hình ảnh đầu vào có cùng tỷ lệ khung hình. Xin hãy sửa tôi nếu tôi sai.
Một cách khác là chỉ thay đổi kích thước mỗi hình ảnh theo kích thước cố định. Tôi nghĩ rằng điều này cũng đã được đề xuất bởi câu trả lời cho câu hỏi này . Tuy nhiên, nó không được chỉ định theo cách thay đổi kích thước hình ảnh.
Tôi đã cân nhắc lấy chiều rộng và chiều cao tối đa trong tập dữ liệu và thay đổi kích thước tất cả các hình ảnh thành kích thước cố định đó để tránh mất thông tin. Tuy nhiên, tôi tin rằng mạng của chúng tôi có thể gặp khó khăn với hình ảnh bị bóp méo vì các cạnh trong ảnh có thể không rõ ràng. Điều gì có thể là cách tốt nhất để thay đổi kích thước hình ảnh của bạn trước khi đưa chúng vào mạng?
Có lựa chọn nào khác mà tôi không biết để giải quyết vấn đề có hình ảnh có kích thước khác nhau không?
Ngoài ra, cách tiếp cận nào bạn nghĩ là tốt nhất có tính đến độ phức tạp tính toán nhưng cũng có thể làm mất hiệu suất của mạng?
Tôi sẽ đánh giá cao nếu câu trả lời cho câu hỏi của tôi bao gồm một số liên kết đến một nguồn nếu có. Cảm ơn bạn.