Xử lý tín hiệu speech-recognition

3

Có ai biết một bộ lọc để làm giảm sự không nói? Tôi đang viết phần mềm nhận dạng giọng nói và muốn lọc ra mọi thứ trừ lời nói của con người. Điều này sẽ bao gồm tiếng ồn nền, tiếng ồn được tạo ra bởi micrô nhảm nhí …

17 filters audio noise speech-recognition

1

Xác định cách âm thanh tương tự như lời nói của con người

Trong khi tìm kiếm một câu trả lời cho vấn đề này, tôi đã tìm thấy bảng này nên đã quyết định đăng chéo câu hỏi này của tôi từ Stack Overflow. Tôi đang tìm kiếm một phương pháp xác định sự giống nhau giữa một đoạn âm thanh và …

12 audio algorithms speech-recognition

1

Làm thế nào để giảm tiếng ồn để nhận dạng giọng nói khác với giảm tiếng ồn được cho là làm cho lời nói trở nên dễ hiểu hơn đối với con người?

bây giờ đây là một câu hỏi khiến tôi quan tâm, chủ yếu là vì bản thân tôi đang làm việc để giảm tiếng ồn cho một hệ thống nhận dạng giọng nói hiện có. Hầu hết các bài báo về các kỹ thuật giảm tiếng ồn dường như tập …

10 noise speech-recognition speech-processing noise-cancellation

1

Thiết kế một vectơ đặc trưng để phân biệt giữa các dạng sóng âm khác nhau

Hãy xem xét 4 tín hiệu dạng sóng sau: signal1 = [4.1880 11.5270 55.8612 110.6730 146.2967 145.4113 104.1815 60.1679 14.3949 -53.7558 -72.6384 -88.0250 -98.4607] signal2 = [ -39.6966 44.8127 95.0896 145.4097 144.5878 95.5007 61.0545 47.2886 28.1277 -40.9720 -53.6246 -63.4821 -72.3029 -74.8313 -77.8124] signal3 = [-225.5691 -192.8458 -145.6628 151.0867 172.0412 172.5784 …

10 computer-vision frequency-spectrum autocorrelation speech-recognition

2

Cách thực hiện chuyển đổi Hough dựa trên độ dốc

Tôi đang cố gắng sử dụng biến đổi Hough để phát hiện cạnh và muốn sử dụng hình ảnh gradient làm cơ sở. Những gì tôi đã làm cho đến nay, do ảnh Ikích thước [M,N]và hàm riêng của nó gx, gylà để tính toán góc gradient trong mỗi điểm …

9 image-processing edge-detection image-processing computer-vision image-registration discrete-signals noise bpsk snr demodulation bpsk multipath synchronization timing image-processing filters algorithms edge-detection sampling demodulation bpsk synchronization timing fft fourier-transform delay audio speech-recognition soft-question discrete-signals discrete-signals autocorrelation frequency computer-vision

1

Làm cách nào để phân đoạn âm thanh cuộc gọi điện thoại thành im lặng / không im lặng?

Vấn đề của tôi là tôi không biết năng lượng của tiếng ồn nền, vì vậy tôi không thể chỉ ngưỡng năng lượng. Việc xử lý được thực hiện trong thời gian thực và tôi có khoảng 500msec để quyết định. Lý tưởng nhất, tôi muốn phụ âm thầm được …

9 audio speech-recognition

2

Một vector vectơ trong một mô hình Markov ẩn có nghĩa là gì?

Tôi biết rằng Mô hình Markov ẩn (HMM) được sử dụng trong nhận dạng giọng nói và hiểu nó ở một mức độ nào đó. Tuy nhiên, điều tôi không biết là làm thế nào đầu vào (lời nói) được "biến đổi" thành một vectơ mà sau này được sử …

8 speech-recognition

3

Làm thế nào để Siri nhận ra tôi nói về Hey Hey Siri?

Tôi cố gắng để hiểu làm thế nào iPhone của tôi có thể tiếp tục lắng nghe tôi nói Hey Siri, Alexa, Hey Cortanahoặc Okay Googlekhông một cách nhanh chóng tháo pin của tôi xuống. Tôi tưởng tượng hai loại thuật toán. Một lát ghi lại thời gian như lát …

8 sound speech-recognition voice

1

Giải thích đồ họa chính xác của một loạt các vectơ MFCC là gì?

Tôi đang nghiên cứu nhận dạng giọng nói, đặc biệt là việc sử dụng MFCC để trích xuất tính năng. Tất cả các ví dụ tôi đã tìm thấy trực tuyến có xu hướng vẽ biểu đồ một loạt MFCC được trích xuất từ một cách nói cụ thể như …

7 speech-recognition mfcc visualization feature-extraction

1

làm thế nào để phương trình này tương ứng với làm mịn?

Xin hãy giúp tôi hiểu làm mịn dữ liệu. Đây là một theo dõi cho câu hỏi trước đây của tôi được đăng ở đây . Đặc biệt là câu trả lời hàng đầu của Junuxx, nơi ông nói một cách làm mịn chức năngf( x )f(x)f(x) Là: f'[ t …

7 speech-recognition smoothing speech

Câu hỏi được gắn thẻ «speech-recognition»