Thiết kế bộ lọc thông thấp để giảm thiểu răng cưa trong âm thanh phát trực tuyến đã được khử trước


7

Tôi cần áp dụng bộ lọc thông thấp cho các tệp PCM. Có một số phương pháp như bộ lọc FIR, bộ lọc IIR (butterworth-ch Quashev ..) nhưng đối với tôi, áp dụng biến đổi Fast Fourier và loại bỏ tần số cao hơn là cách gần nhất với bộ lọc lý tưởng.

Nhanh nhất và gần nhất với phương pháp lọc lý tưởng là gì?

Cần phải khử răng cưa trước khi thay đổi tốc độ lấy mẫu của âm thanh. (Fcutoff = Fs / 2) Và sẽ được áp dụng mỗi khối trong 1 giây. dữ liệu. Yêu cầu chính là, sau khi thay đổi tốc độ mẫu, chất lượng âm thanh mới phải gần nhất có thể với chất lượng âm thanh gốc. (Không ồn ào.)

Cảm ơn.


4
Bạn có thể nên giải thích lý do tại sao bạn muốn lọc dữ liệu này và yêu cầu của bạn là gì từ bộ lọc (tức là thông số bộ lọc của bạn là gì?).
Paul R

Yêu cầu của bạn về sự suy giảm băng tần, độ dốc, độ gợn trong băng thông, v.v ... là gì? Bạn quan tâm đến độ trễ bao nhiêu (Ví dụ: nếu chúng tôi thực hiện theo phương pháp FFT của bạn, một khối N mẫu phải có sẵn trước khi chúng tôi thậm chí có thể viết mẫu đầu ra đầu tiên)?
pichenettes

Nó được yêu cầu để khử răng cưa sau khi thay đổi tốc độ lấy mẫu của âm thanh. Và sẽ được áp dụng mỗi khối 1 giây. dữ liệu. Yêu cầu chính là, sau khi thay đổi tốc độ mẫu, chất lượng âm thanh mới phải gần nhất có thể với chất lượng âm thanh gốc. (Không ồn ào)
Mete

Lưu ý: để lấy mẫu lại, bạn cần áp dụng bộ lọc trước khi thay đổi tốc độ mẫu (thông qua số thập phân hoặc bất cứ điều gì).
Paul R

Tỷ lệ mẫu trước và sau là gì? Họ đã sửa chưa? Có phải chúng luôn luôn là một tỷ lệ số nguyên (ví dụ 44,1 kHz => 22,05 kHz)?
Paul R

Câu trả lời:


8

Sự lựa chọn tốt nhất của bộ lọc phụ thuộc vào yêu cầu ứng dụng cụ thể của bạn. Có hai lựa chọn cơ bản: FIR và IIR. IIR sẽ hiệu quả hơn nhiều, tuy nhiên, nó sẽ dẫn đến biến dạng pha. Các biến dạng pha hoàn toàn không nghe thấy được (trừ khi đó là trường hợp ngoại lệ kỳ quái) nhưng rõ ràng có thể đo lường được. Vì vậy, nó phụ thuộc vào việc bạn có thể chịu đựng điều này không.

Trong cả hai trường hợp, bạn cần phải quyết định mức độ cần thiết để đạt được tần số Nyquist mới và mức độ nhiễu răng cưa bạn có thể chịu đựng được. Một ví dụ điển hình là bạn muốn băng thông mở rộng tới 90% tần số Nyquist mới và bạn muốn các sản phẩm răng cưa của mình ở dưới -80dB. Dựa trên các thông số kỹ thuật này, sau đó bạn có thể thiết kế bộ lọc phù hợp. Các cân nhắc khác bao gồm mức độ gợn băng thông bạn có thể chấp nhận và nếu bạn có bất kỳ ràng buộc nào về độ trễ nhóm và / hoặc độ trễ tối đa.

Dưới đây là một ví dụ: giả sử bạn muốn giảm mẫu từ 44,1 kHz xuống 32 kHz và tần số Nyquist mới là 16kHz. Chuyển đến 90% Nyquist (14400 Hz), với độ gợn của dải thông 0,1dB và độ suy giảm 80 dB ở 16 kHz có thể được thực hiện với bộ lọc hình elip ở bậc 9.

Như nibot đã chỉ ra, các thùng FFT zeroing là một lựa chọn kém cho bộ lọc thông thấp vì đường chuyền thấp có thùy bên rất lớn và từ chối răng cưa sẽ khá kém. Nó cũng sẽ yêu cầu thực hiện đúng thuật toán chồng chéo hoặc thêm chồng chéo để xử lý tín hiệu liên tục.


1
Là biến dạng pha thực sự không nghe thấy? Nó đã được thể hiện như vậy trong các thí nghiệm?
endolith

1
Có một khối lượng lớn các công trình khoa học về chủ đề này. Tai người khá nhạy cảm với dịch chuyển pha đơn sắc (nhưng RẤT nhạy cảm với pha hai tai). Trong trường hợp này, bất kỳ biến dạng pha nào cũng sẽ gần với giao thoa ở tần số cao, nơi có ít năng lượng để bắt đầu. Trừ khi nó cực kỳ khó có thể tạo ra sự khác biệt rõ ràng
Hilmar

Phải, vì vậy nó nghe được. :) Đây thực sự là một vấn đề tồi tệ như thế nào bạn có thể bóp méo nó trước khi con người chú ý, không phải là một thứ âm thanh / không nghe thấy nhị phân. Vì vậy, một thiết kế bộ lọc thực sự kém có thể nghe thấy được, đặc biệt nếu nó hoạt động trên dữ liệu âm thanh nổi, điều này gần như luôn luôn đúng.
endolith

@endolith: không thực sự - biến dạng pha thường giống nhau ở cả hai kênh trái và phải ở bất kỳ tần số nhất định nào, do đó sẽ không có biến dạng pha hai bên có thể nhận biết được , đó là điều mà bộ não phát hiện tốt (đó là một phần lớn của cách chúng tôi bản địa hóa âm thanh). Chúng tôi không nhận thấy sự biến dạng pha đơn cực vì nó không có giá trị tiến hóa.
Paul R

1
Nhận thức của con người hiếm khi có màu đen và trắng. Dưới đây là một tổng quan thú vị về nghiên cứu nhận thức giai đoạn monaural âm nhạc.princeton.edu / ~ john / monauralphaseexperiment.htmlm . Quan điểm của tôi là tai người không nhạy cảm lắm với pha đơn âm và loại trễ pha hoặc nhóm được giới thiệu bởi bộ lọc khử răng cưa khó có thể nghe thấy được.
Hilmar

0

Không có "tốt nhất" hay "lý tưởng" đơn giản. Chỉ có sự đánh đổi phù hợp hơn với các yêu cầu hoặc ưu tiên cụ thể của bạn (và do đó là một kết quả kém hơn đối với những người khác.)

Trong trường hợp khử răng cưa, các yêu cầu có thể bao gồm gợn tối đa, độ rộng chuyển tiếp, độ tuyến tính pha, trợ cấp cho vòng trước, độ trễ tối đa, chu kỳ tính toán hoặc yêu cầu năng lượng hoặc giới hạn, giới hạn bộ nhớ, tần số notch cụ thể, v.v.

Các thùng FFT Zeroing rất tuyệt vời trong việc cung cấp các chuyển tiếp dốc và các rãnh sắc nét, và một trong những giải pháp tồi tệ nhất có thể để đáp ứng bất kỳ đặc điểm kỹ thuật gợn sóng dải dừng nào (cộng với nó có thể đổ chuông trong dải thông). Bạn muốn gì?

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.