Đầu vào nào để sử dụng cho mô hình AR của âm nguyên âm?


8

Tôi đã ghi lại cách phát âm 2 giây của âm nguyên âm. 0,12 giây đầu tiên của tín hiệu được hiển thị bên dưới.

Bây giờ, tôi đã xây dựng mô hình bậc 8 tự động hồi quy (AR) để nén tín hiệu này. (Trên thực tế, tôi chỉ lập mô hình 160 mẫu hoặc 0,02 giây một lần.) arHàm trong Hộp công cụ nhận dạng hệ thống của Matlab có thể ước tính các tham số cho phù hợp phổ "tối ưu".

Vấn đề của tôi là chọn đầu vào ngẫu nhiên cho bộ lọc mô hình. Tôi cho rằng có một cái gì đó tốt hơn tiếng ồn trắng. Tính chu kỳ (14 tiết trên 0,02 giây) khiến tôi nghĩ rằng một chuyến tàu thúc đẩy có cùng thời gian sẽ phù hợp.

Nếu vậy, làm thế nào tôi chọn biên độ, và làm thế nào tôi tìm thấy tính tuần hoàn? Ước tính ACF và PSD khá ồn ào. Tôi thậm chí đang đi đúng hướng?

nhập mô tả hình ảnh ở đây


1
FYI, tôi đã kết thúc việc mở rộng xung lực sao cho năng lượng tín hiệu của nó (được đo trong miền thời gian) giống như tín hiệu được ghi lại.
Andreas

Câu trả lời:


5

Một công cụ ước tính cao độ thường được sử dụng để tìm ra tính tuần hoàn của giọng hát. Các công cụ ước tính cường độ phổ biến bao gồm phân tích cepstrum / cepstral, phổ sản phẩm hài hòa và các thuật toán tổng hợp, chẳng hạn như YAAPT .


Cảm ơn. Làm thế nào tôi nên chọn biên độ xung?
Andreas

4

Tôi nghĩ rằng đặt cược tốt nhất của bạn là máy phát hiện độ cao "YIN", được mô tả trong bài viết này: http://audition.ens.fr/adc/pdf/2002_JASA_YIN.pdf . Nó khá đơn giản và thực hiện rất tốt. Họ trình bày nó theo các bước, hoặc cải tiến theo ý tưởng trước đó, và thậm chí chỉ cần thực hiện một vài bước đầu tiên là đủ.

Hầu hết các máy dò cao độ thực sự được sử dụng có liên quan đến tự động tương quan. Vấn đề lớn nhất với hầu hết các thuật toán phát hiện cao độ là các lỗi quãng tám - hoặc phát hiện cao độ thấp hơn hoặc cao hơn. Thật thú vị khi bạn nói chức năng tự tương quan của bạn là ồn ào. Bạn sẽ thấy một loạt các nhiễu, với các đỉnh ở bội số nguyên và ước của tần số cơ bản. Hy vọng độ trễ cao độ tương ứng với tần số cơ bản có giá trị lớn nhất, nhưng thường thì nó sẽ ở một quãng tám phụ (vì các tín hiệu không hoàn toàn định kỳ) hoặc ở quãng tám cao hơn (vì một định dạng mạnh gây ra một trong những mức cao hơn hòa âm để được thực sự lớn). Tôi muốn giới thiệu một kích thước cửa sổ lớn bằng hai trong số các khoảng thời gian thấp nhất có thể của bạn.

Tín hiệu đó cũng có vẻ như có thành phần tần số rất thấp - lời nói thường không phát sóng lên xuống như thế. Tôi có thể khuyên bạn nên xử lý nó với bộ lọc thông cao 24 dB / oct ở khoảng 50 Hz.


Cảm ơn cả hai bạn, tôi sẽ kiểm tra những máy dò cao độ đó. Khi khoảng thời gian được ước tính, làm thế nào tôi có thể tìm thấy biên độ phù hợp cho tàu xung?
Andreas
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.