Câu hỏi được gắn thẻ «speech-recognition»

Nhận dạng giọng nói là quá trình chuyển đổi từ được nói thành văn bản, thường mà không liên quan đến một người nói cụ thể (thường được gọi là "nhận dạng giọng nói").

3
bộ lọc tiếng nói của con người
Có ai biết một bộ lọc để làm giảm sự không nói? Tôi đang viết phần mềm nhận dạng giọng nói và muốn lọc ra mọi thứ trừ lời nói của con người. Điều này sẽ bao gồm tiếng ồn nền, tiếng ồn được tạo ra bởi micrô nhảm nhí …


1
Làm thế nào để giảm tiếng ồn để nhận dạng giọng nói khác với giảm tiếng ồn được cho là làm cho lời nói trở nên dễ hiểu hơn đối với con người?
bây giờ đây là một câu hỏi khiến tôi quan tâm, chủ yếu là vì bản thân tôi đang làm việc để giảm tiếng ồn cho một hệ thống nhận dạng giọng nói hiện có. Hầu hết các bài báo về các kỹ thuật giảm tiếng ồn dường như tập …

1
Thiết kế một vectơ đặc trưng để phân biệt giữa các dạng sóng âm khác nhau
Hãy xem xét 4 tín hiệu dạng sóng sau: signal1 = [4.1880 11.5270 55.8612 110.6730 146.2967 145.4113 104.1815 60.1679 14.3949 -53.7558 -72.6384 -88.0250 -98.4607] signal2 = [ -39.6966 44.8127 95.0896 145.4097 144.5878 95.5007 61.0545 47.2886 28.1277 -40.9720 -53.6246 -63.4821 -72.3029 -74.8313 -77.8124] signal3 = [-225.5691 -192.8458 -145.6628 151.0867 172.0412 172.5784 …

2
Cách thực hiện chuyển đổi Hough dựa trên độ dốc
Tôi đang cố gắng sử dụng biến đổi Hough để phát hiện cạnh và muốn sử dụng hình ảnh gradient làm cơ sở. Những gì tôi đã làm cho đến nay, do ảnh Ikích thước [M,N]và hàm riêng của nó gx, gylà để tính toán góc gradient trong mỗi điểm …





Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.