Tôi đang cố gắng phát hiện và phân loại âm thanh không nói. Hiện tại, tôi đang sử dụng một loạt các phổ công suất di chuyển chồng chéo từ âm thanh đào tạo như các tính năng tôi đang tìm kiếm.
Khi tôi phân tích, tôi chỉ tính toán cùng một lượng phổ chồng chéo để số lượng các tính năng là như nhau. Ngay bây giờ hiệu suất không được tốt lắm, nó chỉ có thể phát hiện sự im lặng và không im lặng.
Những kỹ thuật nào cho loại phát hiện tín hiệu này? Một trong những mối quan tâm của tôi là đối với các âm thanh có độ dài khác nhau trong miền thời gian sẽ dẫn đến các vectơ đặc trưng có độ dài khác nhau, do đó tôi không thể sử dụng cùng một trình phân loại, tôi bị mắc kẹt trong vấn đề này.