DFT với các thùng có khoảng cách hình học?


16

Biến đổi Fourier rời rạc truyền thống (DFT) và anh em họ của nó, FFT, tạo ra các thùng được đặt cách đều nhau. Nói cách khác, bạn nhận được một cái gì đó giống như 10 hertz đầu tiên trong thùng thứ nhất, 10,1 đến 20 trong giây thứ hai, v.v. Tuy nhiên, tôi cần một chút gì đó khác biệt. Tôi muốn phạm vi tần số được bao phủ bởi mỗi thùng để tăng hình học. Giả sử tôi chọn hệ số nhân là 1,5. Sau đó, chúng ta có 0 đến 10 trong thùng thứ nhất, tôi muốn 11 đến 25 trong thùng thứ hai, 26 đến 48 trong thùng thứ ba, v.v. Có thể sửa đổi thuật toán DFT để hành xử theo cách này không?


Bạn luôn có thể tính toán DFT tại các điểm quan tâm. Ngoài ra, các ngân hàng chuyển đổibộ lọc Wavelet rời rạc đến với tôi. Có thể đáng để nhìn vào họ.

2
Bạn đang tìm kiếm Biến đổi Q liên tục (CQT) .
Paul R

2
Từ ngữ kém. Những gì bạn muốn không phải là mới, cũng không phải là một sự cải thiện trong nhiều trường hợp.
hotpaw2


2
DFT và FFT không phải là anh em họ. Họ cho kết quả giống hệt nhau.
Phonon

Câu trả lời:


17

Để trích dẫn luận văn của tôi:

Một tập hợp các biến đổi được đặt tên hằng số Q và tương tự như biến đổi Fourier.

Tính toán của biến đổi Fourier rời rạc có thể rất hiệu quả khi sử dụng biến đổi Fourier nhanh. Tuy nhiên, chúng tôi nhận thấy rằng năng lượng của tín hiệu được chia thành các nhóm tần số có kích thước đồng đều trên toàn phổ. Mặc dù trong nhiều trường hợp điều này là hữu ích, chúng tôi nhận thấy các tình huống trong đó phân phối thống nhất này là tối ưu phụ. Một ví dụ quan trọng của trường hợp như vậy được quan sát với việc phân tích tần số âm nhạc. Trong âm nhạc phương Tây, các tần số tạo nên các thang âm nhạc được đặt cách nhau về mặt hình học. Do đó, chúng ta thấy rằng bản đồ giữa các thùng tần số của biến đổi Fourier rời rạc và tần số của thang âm nhạc là không đủ theo nghĩa là các thùng khớp kém. Biến đổi Q không đổi giải quyết vấn đề này.

Mục đích của hằng số Q là tạo ra một tập hợp các thùng tần số cách nhau logarit trong đó chiều rộng của thùng tần số là sản phẩm của trước đó. Do đó, chúng tôi có thể tạo ra số lượng thùng giống hệt nhau cho mỗi nốt nhạc trên phổ âm thanh, do đó duy trì mức độ chính xác không đổi cho mỗi nốt nhạc. Các thùng tần số trở nên rộng hơn về phía tần số cao hơn và hẹp hơn về phía tần số thấp hơn. Điều này lan truyền trong độ chính xác của phát hiện tần số bắt chước chặt chẽ cách thức mà hệ thống thính giác của con người phản ứng với tần số.

Ngoài ra, sự kết hợp chặt chẽ của các ghi chú ở quy mô phương tây làm cho hằng số Q đặc biệt hữu ích trong việc phát hiện ghi chú; xác định một giá trị ghi chú âm nhạc hơn là một giá trị tần số rõ ràng. Hơn nữa, hằng số Q đơn giản hóa quá trình phân tích âm sắc. Tần số của một nốt nhạc được chơi bởi một nhạc cụ thường bao gồm các phần liên quan đến hài hòa. Âm sắc của nhạc cụ có thể được đặc trưng bởi các tỷ lệ của hòa âm. Với biến đổi Q không đổi, các sóng hài được đặt cách đều nhau trên các thùng bất kể tần số cơ bản. Điều này giúp đơn giản hóa rất nhiều quá trình xác định một nhạc cụ chơi một nốt nhạc ở bất cứ đâu trong thang âm chỉ bằng cách thay đổi đặc tính trên các thùng.

Một thuật toán hiệu quả để chuyển đổi một biến đổi Fourier rời rạc (có thể được tính toán với FFT) thành một biến đổi Q không đổi được trình bày chi tiết trong Brown và Puckette (1992).


1

Có các giả định toán học quan trọng trong DFT (FFT). Điều quan trọng nhất trong trường hợp này là bạn đang thực hiện một phép biến đổi hình sin thời gian vô hạn cắt ngắn. Thứ hai là thời gian bị cắt ngắn và tín hiệu tần số bị cắt ngắn được giả sử là được bọc modulo (hình tròn.) Các thùng được đặt cách nhau trong một FFT bình thường tạo thành một tập hợp trực giao chỉ vì những giả định này (và cả khoảng cách cảm giác đối xứng.) do đó, cặp tần số thời gian <-> hoàn toàn có thể đảo ngược.

Biến đổi Q không đổi không cắt ngắn một cách độc đáo, do đó, bất kỳ triển khai thực tế nào cũng không mang lại kết hợp chỉnh hình hoàn hảo. Hạt nhân là một hình sin phân rã theo cấp số nhân dài vô hạn và do đó không thể có lợi thế hình tròn được chỉ ra ở trên. Nếu bạn không cắt ngắn, chúng sẽ tạo thành một bộ chỉnh hình.

Các biến đổi wavelet thường có khoảng cách bằng 2, không hữu ích cho việc ước tính tần số hạt mịn.

Đề xuất không gian không đồng đều một DFT hình sin tiêu chuẩn sẽ bỏ lỡ thông tin trong khu vực có khoảng cách rộng rãi trong khi nó sẽ sao chép thông tin trong khu vực có mật độ dày đặc. Trừ khi, một hàm apodization khác nhau được sử dụng cho mỗi tần số ... rất tốn kém.

Một giải pháp thực tế là thực hiện một quy trình lặp lại nửa phổ-> decimate-by-2 để có được các phần phụ dựa trên quãng tám để đáp ứng một số lỗi ước lượng minimax trên mỗi quãng tám. Tỷ lệ phần phổ-> decimate-by-ratio có thể được đặt thành bất kỳ tỷ lệ nào để đạt được bất kỳ nhu cầu chi tiết nào. Mặc dù vậy, vẫn khá chuyên sâu tính toán.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.