Tôi đã xem qua các tài liệu tích chập của máy ảnh và tôi đã tìm thấy hai loại kết hợp Conv1D và Conv2D. Tôi đã thực hiện một số tìm kiếm trên web và đây là những gì tôi hiểu về Conv1D và Conv2D; Conv1D được sử dụng cho các chuỗi và Conv2D sử dụng cho hình ảnh.
Tôi luôn nghĩ rằng các mạng nerual chập chỉ được sử dụng cho hình ảnh và hình dung CNN theo cách này
Một hình ảnh được coi là một ma trận lớn và sau đó một bộ lọc sẽ trượt qua ma trận này và tính toán sản phẩm chấm. Điều này tôi tin rằng những gì keras đề cập đến như một Conv2D. Nếu Conv2D hoạt động theo cách này thì cơ chế của Conv1D là gì và làm thế nào chúng ta có thể tưởng tượng cơ chế của nó?