bộ lọc tái cấu trúc - Nó thực sự hoạt động như thế nào?


8

Tôi đang cố gắng hình thành sự hiểu biết của riêng mình về cuộc chiến tôn giáo xung quanh việc sử dụng 192kHz làm tốc độ lấy mẫu để phát lại (Internet dường như có vô số tài liệu ở cả hai phía). Tôi đang đấu tranh để hiểu làm thế nào các bộ lọc xây dựng lại hoạt động.

Các lấy mẫu lý Nyquist-Shannon , thường được trích dẫn bởi các anti-192 trại, về cơ bản nói rằng một tỷ lệ mẫu 44.1kHz là đủ để tái tạo lại mà không mất một tín hiệu băng hạn chế số 20kHz. Tuy nhiên, khi xem công thức nội suy của Whittaker, Shannon , tôi thấy rằng một bộ lọc tái cấu trúc lý tưởng sẽ cần có quyền truy cập vào tất cả các mẫu , tức là tất cả các mẫu trong quá khứ và tất cả các mẫu trong tương lai.

Tôi không phải là một chuyên gia về âm thanh analog, nhưng tôi nghi ngờ rằng một thiết bị như vậy có thể được chế tạo. Tôi cho rằng, tốt nhất, một sự chậm trễ có thể được đưa ra để "chờ" cho đủ các mẫu trong tương lai đến, do đó sự đóng góp của các mẫu không có sẵn trong tương lai cho sản lượng hiện tại trở nên không đáng kể.

Ai đó có thể giải thích làm thế nào các bộ lọc tái thiết thực tế hoạt động và sự đánh đổi của họ là gì? Có giới hạn chặt chẽ hơn về mặt lý thuyết đối với định lý Nyquist-Shannon nếu chỉ có một cửa sổ mẫu hoặc nếu độ trễ tái thiết là không thể chấp nhận?

Câu trả lời:


1

Bằng cách cho phép tăng độ trễ được giới thiệu bởi bộ lọc oversampling kỹ thuật số, các đặc điểm khác của bộ lọc, vượt qua dải gợn và dừng dải băng và độ rộng dải chuyển tiếp, có thể được cải thiện tùy ý gần bằng không. Hệ số bội số có thể được tăng lên để mở rộng dải dừng và để giảm bớt các yêu cầu về lọc tương tự, dẫn đến độ phức tạp tính toán tăng nhưng không làm tăng đáng kể thời gian trễ do bộ lọc đưa ra.

Audio DAC thường có bộ lọc oversampling kỹ thuật số có thể lựa chọn giữa bộ lọc độ trễ thời gian thấp (độ trễ) và bộ lọc cuộn đáp ứng tần số sắc nét. Bộ lọc độ trễ thấp có thể là bộ lọc pha tối thiểu hoặc thỏa hiệp điều chỉnh tâm lý giữa độ phân tán thấp (một số tần số bị trễ nhiều hơn các tần số khác) và độ trễ hiệu quả thấp. Bộ lọc roll-off sắc nét thường là bộ lọc pha tuyến tính với đáp ứng xung đối xứng và độ gợn tối đa được chỉ định trong dải thông và trong dải dừng. Loại đặc tả này dễ dàng thể hiện trong biểu dữ liệu và kết hợp trong thiết kế hệ thống. Các bộ lọc pha tuyến tính tương đương có thể được thiết kế trong Octave bằng cách sử dụng remez, ở đây với trọng lượng tương đương của dải thông và gợn dải dừng:

pkg load signal
x2x = []; x4x = [];
for n = [16:86]
  b2x = remez(2*n, [0, 20/44.1, (44.1-20)/44.1, 1], [1, 1, 0, 0], [1, 1], "bandpass", 128);
  b4x = remez(2*n, [0, 20/(44.1*2), (44.1-20)/(44.1*2), 1], [1, 1, 0, 0], [1, 1], "bandpass", 128);
  [h2x, w2x] = freqz(b2x); [h4x, w4x] = freqz(b4x);
  x2x = [x2x; (length(b2x)-1)/2/2, 20*log10(abs(h2x(end)))];
  x4x = [x4x; (length(b4x)-1)/2/4, 20*log10(abs(h4x(end)))];
endfor
plot(x2x(:,1), x2x(:,2), "x", x4x(:,1), x4x(:,2), "x", 29.2, -100, "x", 39.5, -110, "x", 43.3828125, -110, "x")
xlabel("group delay / f_s");
ylabel("stop band ripple (dB)");
text(29.2-2, -100-4, "AK4499");
text(39.5-2, -110+4, "CS43198");
text(43.3828125-2, -110-4, "AD1955");
grid on

Kịch bản thiết kế các bộ lọc thứ tự khác nhau (bị giới hạn bởi những gì remezcó thể xử lý mà không gặp sự cố về số) cho dải thông từ 0 đến 20 kHz và dải dừng bắt đầu ở 24,1 kHz, được vận hành ở một lựa chọn nhỏ tần số lấy mẫu quá khổ 2 và 4 lần tần số lấy mẫu 44,1 kHz và các sơ đồ (Hình 1) các đặc tính gợn sóng dải dừng cùng với các bộ lọc kỹ thuật số quá khổ tương đương của bộ âm thanh hàng đầu của DAC từ Asahi Kasei ( AK4499 ), Thiết bị analog ( AD1955 ) và Cirrus Logic ( CS43198 ).

nhập mô tả hình ảnh ở đây
Hình 1. Dừng gợn băng tần và băng thông dải cho remezcác bộ lọc kỹ thuật số vượt qua pha tuyến tính pha chéo 2 lần (màu xanh dương) và 4x (màu cam) với chức năng vượt qua và giảm trọng lượng băng tần bằng nhau, như chức năng của một nửa đáp ứng xung theo đơn vị của thời gian lấy mẫu ở tần số lấy mẫu 1x là 44,1 kHz. Ngoài ra âm mưu là các số liệu hiệu suất gợn dải dừng cho lựa chọn các bộ lọc chồng chéo DAC với độ gợn băng thông tương ứng được chỉ định là 5 × 10 ^ -3 dB cho bộ lọc kỹ thuật số oversampling 8x của AK4499, 10 ^ -2 dB cho kỹ thuật số kết hợp và bộ lọc tương tự CS43198 và 2 × 10 ^ -4 dB cho bộ lọc kỹ thuật số oversampling 8x của AD1955. Tất cả các bộ lọc được so sánh ở đây có ranh giới dải chuyển tiếp giống hệt nhau: 20 kHz đến 24.1 kHz.

Đối với tần số lấy mẫu 44,1 kHz, Hình 1 đưa ra giới hạn thấp hơn về hiệu suất của bộ lọc kỹ thuật số pha quá mức pha tuyến tính như chức năng của độ trễ được giới thiệu bởi bộ lọc, khi dải tần và dải gợn dải dừng có trọng số như nhau. Ràng buộc này không phụ thuộc đáng kể vào tỷ lệ quá khổ. Các nhà sản xuất DAC có thể chọn một trọng số khác, ví dụ để đạt được gợn dải dừng thấp hơn bằng cách tăng gợn băng thông, như trong trường hợp của AK4499. Họ cũng có thể tối ưu hóa các bộ lọc theo các tiêu chí khác ngoài phương pháp nghiêm ngặt. Ví dụ, bộ lọc có thể bao gồm bù cho sự suy giảm tần số cao bằng mạch tương tự (giữ không thứ tự, bộ lọc RC, v.v.) và các đặc tính độ trễ của bộ lọc có thể bị ảnh hưởng khi sử dụng triển khai đa tốc độ tính toán hiệu quả.

Chúng ta có thể xem xét kỹ hơn về bộ lọc hiệu suất cao nhất trong Hình 1, xuất phát từ remez(2*86, [0, 20/44.1, (44.1-20)/44.1, 1], [1, 1, 0, 0], [1, 1], "bandpass", 128), bằng cách vẽ đáp ứng xung của nó (Hình 2) và đáp ứng tần số bằng cách sử dụng freqz(Hình 3):

nhập mô tả hình ảnh ở đây
Hình 2. Đáp ứng xung của bộ lọc oversampling 2x pha tuyến tính hiệu suất cao nhất từ remez.

nhập mô tả hình ảnh ở đây
Hình 3. Đáp ứng tần số của bộ lọc oversampling 2x pha tuyến tính hiệu suất cao nhất từ remez.

Sẽ thú vị hơn khi xem xét các bộ lọc oversampling 8x, nhưng remezthất bại với error: remez: insufficient extremals--cannot continue.


bạn biết; khi một cái gì đó (hệ thống âm thanh) nghe thực sự tốt, thì lời giải thích của nó (bảng dữ liệu) phải làm tốt hơn nữa! .. :-) Đó là cách họ làm cho nó trong ngành công nghiệp âm thanh thương mại ... ;-))
Fat32

Ồ Tôi cần đọc lại câu trả lời của bạn một vài lần nữa để xử lý đầy đủ. Công việc tốt! Chỉ cần xác nhận rằng tôi đã nhận được ý chính của nó, một bộ xử lý chất lượng cao với lớp phủ kỹ thuật số giới thiệu độ trễ 0,6-1ms ở tần số lấy mẫu là 44,1kHz?
dùng1202136

@ user1202136 đúng, nếu bộ lọc roll-off sắc nét được chọn.
Olli Niemitalo

4

Định lý lấy mẫu yêu cầu tín hiệu được phân tách hoàn hảo, được giới hạn ở mức dưới hai lần tần số lấy mẫu. Vấn đề với điều này là chỉ một tín hiệu có độ dài vô hạn (ví dụ như tồn tại trước vụ nổ lớn) có thể được phân tách hoàn toàn. Đây là từ định lý Fourier liên quan đến bất kỳ miền nào có hỗ trợ hữu hạn.

Do đó, tất cả các tín hiệu trong thế giới thực đều bị giới hạn băng tần không hoàn hảo, bị giới hạn bởi độ dài của phiên ghi và thời lượng đáp ứng xung của bộ lọc thông thấp được sử dụng trước khi lấy mẫu (ví dụ: giới hạn băng không hoàn hảo). Vì vậy, bạn phải giả sử một sàn tiếng ồn hữu hạn do răng cưa mẫu. Do đó, việc tái thiết của bạn cũng không thể tốt hơn tầng tiếng ồn này. Do đó, bạn có thể cửa sổ công thức tái cấu trúc hoàn hảo đến một số thời gian hữu hạn hợp lý. Đối với âm thanh, độ rộng cửa sổ này có thể được giới hạn theo thứ tự bội số nhỏ của khoảng thời gian có thể nghe thấy tần số thấp nhất, vì những thứ trước và sau đó không thể ảnh hưởng đáng kể đến nhận thức cao độ âm thanh (những thứ khác, như che lấp và ngưỡng thích ứng , v.v., có khả năng thống trị).

Ưu điểm của tốc độ mẫu rất cao là tần số bí danh (do lọc trước khi lấy mẫu không hoàn hảo và tái cấu trúc sau lấy mẫu) thậm chí còn cao hơn và ít có khả năng được chọn bởi micrô vật lý hoặc vượt qua với bất kỳ cường độ đáng kể nào (ở trên tầng tiếng ồn nhiệt, vv) thông qua các bộ lọc khử răng cưa. Như các câu trả lời khác ở đây chi tiết, điều này cũng cho phép các bộ lọc vật lý có thể phẳng hơn và có phản ứng pha tuyến tính nhiều hơn trong dải thông 20-20k chung, và cuộn lại gần bằng một nửa tốc độ mẫu.


Mối quan hệ được đề xuất giữa chiều rộng cửa sổ và tần số âm thanh thấp nhất hoàn toàn là ngẫu nhiên, phải không?
Olli Niemitalo

2

Một câu trả lời nhanh, nhưng vì thính giác của con người không vượt quá băng thông 20kHz, 44,1 kHz là đủ để lưu trữ và truyền âm thanh. Vấn đề là bộ lọc khử răng cưa tương tự trước ADC phải cực kỳ sắc nét để vượt qua đủ 20 kHz và đủ 22,05 kHz và điều này chỉ cần nhiều thành phần có hiệu suất và dung sai tốt. Khi lấy mẫu ở tốc độ cao hơn như 192 kHz, bộ lọc analog có thể đơn giản và rẻ hơn vì nó có dải chuyển tiếp rộng hơn nhiều, nó cần phải vượt qua 20 kHz và chặn ở 96 kHz. Việc chuyển đổi tỷ lệ và lọc thông thấp có thể được thực hiện bằng kỹ thuật số để có mức cắt sắc nét mà không cần răng cưa. Điều tương tự khi phát lại âm thanh, upample và tái cấu trúc kỹ thuật số tín hiệu thành 192 kHz để phát lại và bộ lọc analog đầu ra DAC có thể rẻ và đơn giản. Bộ lọc tái cấu trúc chỉ cần đủ tốt để không có nhiều hình ảnh phổ bí danh sau băng thông âm thanh 20kHz và bộ lọc tương tự loại bỏ hình ảnh phổ thực tế của tốc độ DAC. Do đó, nên sử dụng tốc độ cao hơn ở ADC và DAC, và có thể làm chủ âm thanh, nhưng truyền và lưu trữ tần số mà chỉ chó và dơi mới có thể nghe được chi phí cao hơn, chưa kể đến thiết bị (amp, loa) có khả năng tạo ra chúng không có vấn đề Vì vậy, về cơ bản, mẫu kỹ thuật số chỉ là một xung hẹp vô hạn và các xung được lặp lại ở tốc độ lấy mẫu tạo ra các hình ảnh phổ phải được lọc bởi bộ lọc tái tạo mà chỉ đơn giản là giữ nguyên tín hiệu băng cơ sở dự định. Do đó, nên sử dụng tốc độ cao hơn ở ADC và DAC, và có thể làm chủ âm thanh, nhưng truyền và lưu trữ tần số mà chỉ chó và dơi mới có thể nghe được chi phí cao hơn, chưa kể đến thiết bị (amp, loa) có khả năng tạo ra chúng không có vấn đề Vì vậy, về cơ bản, mẫu kỹ thuật số chỉ là một xung hẹp vô hạn và các xung được lặp lại ở tốc độ lấy mẫu tạo ra các hình ảnh phổ phải được lọc bởi bộ lọc tái tạo mà chỉ đơn giản là giữ nguyên tín hiệu băng cơ sở dự định. Do đó, nên sử dụng tốc độ cao hơn ở ADC và DAC, và có thể làm chủ âm thanh, nhưng truyền và lưu trữ tần số mà chỉ chó và dơi mới có thể nghe được chi phí cao hơn, chưa kể đến thiết bị (amp, loa) có khả năng tạo ra chúng không có vấn đề Vì vậy, về cơ bản, mẫu kỹ thuật số chỉ là một xung hẹp vô hạn và các xung được lặp lại ở tốc độ lấy mẫu tạo ra các hình ảnh phổ phải được lọc bởi bộ lọc tái tạo mà chỉ đơn giản là giữ nguyên tín hiệu băng cơ sở dự định.


"Điều tương tự khi phát lại âm thanh, lấy mẫu và tái cấu trúc kỹ thuật số tín hiệu thành 192 kHz để phát lại": Đây là lúc tôi đấu tranh để hiểu. Giả sử là đầu ra được ghép của bạn ở 192kHz và là đầu vào 48kHz của bạn. Để tính toán chính xác, bạn không cần phải biết tất cả ? Nếu có, làm thế nào để bạn upample trong thời gian thực, khi bạn không biết các mẫu đầu vào quá ? y[4n]x[n]y[j]x[i],i=0,nj/4
dùng1202136

1
Các bộ lọc kỹ thuật số có thể thực hiện tốt không thể nhìn thấy trong tương lai, vì vậy chúng là nguyên nhân và chỉ hoạt động với các mẫu hiện tại và quá khứ. Do đó, bộ lọc FIR đối xứng với N vòi có độ trễ N / 2 vòi. Và bộ lọc có một số lượng vòi nhỏ, chỉ đủ để có đủ bộ lọc trong phạm vi dung sai được chỉ định. Hoặc nó có thể là bộ lọc IIR. Hoặc biquad. Hoặc nhiều bộ lọc xếp tầng. Hoặc không có bộ lọc nào cả, chỉ cần thêm số không giữa các mẫu thực tế và để bộ lọc tương tự thực hiện công việc.
Justme

2

Xem xét các ứng dụng âm thanh cơ bản, bộ lọc tái tạo chuyển đổi kỹ thuật số sang tương tự (hay còn gọi là bộ lọc nội suy) là bộ lọc tương tự thông thấp loại bỏ tất cả phổ hình ảnh ở đầu ra trước khi chuyển sang loa và chỉ giữ lại phổ dải tần nằm trong dải thông của bộ lọc : bên trong tần số cắt của bộ lọc thông thấp. Lưu ý rằng bản thân loa cũng là một phần mạnh mẽ của các đặc tính bộ lọc thông thấp tái cấu trúc và các bộ lọc lý tưởng có thể được thư giãn đủ trong các điều kiện phù hợp.

Băng thông này (hoặc tần số cắt) của bộ lọc nội suy lý tưởng nên được chọn theo tốc độ lấy mẫu đầu vào của tín hiệu số. Nếu tín hiệu ban đầu đã được lấy mẫu đầy đủ ở 44,1 kHz mà không răng cưa, sau đó dưới điều kiện bình thường (giả sử không chuyển đổi mẫu suất trong hệ thống), các đầu ra tần số lấy mẫu DAC và các tần số cutofff lọc nội suy có liên quan nên được chọn là 44,1 kHz và 22,05 kHz tương ứng.

Nếu đầu vào được lấy mẫu ở 96 kHz, thì tần số DAC tái cấu trúc đầu ra phải là 96 kHz và bộ lọc tái tạo phải có tần số cắt là 48 kHz, v.v ... Lưu ý rằng lý thuyết sử dụng các xung lý tưởng và bộ lọc lý tưởng để mô tả sự vật ( như tôi đã làm ở trên) nhưng mạch DAC thực tế sử dụng giữ không thứ tự ở đầu ra và các bộ lọc thực tế.

Lưu ý rằng nếu có sự không phù hợp giữa tốc độ lấy mẫu đầu vào và đầu ra thì tốc độ phát lại sẽ không khớp với tốc độ ghi. Ngoài ra, nếu bạn chọn tần số cắt thấp hơn mức tối thiểu cần thiết là tần số Nyquist của tốc độ lấy mẫu DAC đầu ra, thì bạn sẽ phát ra phổ tín hiệu. Ngoài ra nếu bạn chọn tần số cắt của bộ lọc nội suy lớn hơn tần số Nyquist thì bạn sẽ bị biến dạng hình ảnh ở đầu ra âm thanh.

chỉ một trong những cuộc chiến tôn giáo trên âm thanh kỹ thuật số là về tốc độ lấy mẫu 96 kHz ở đầu vào có thực sự cần thiết hay không. Và sự đồng thuận (?) Là, nó không cần thiết, dựa trên thử nghiệm thực nghiệm được tiến hành rất nhiều lần. Nhưng auidophiles có thể tự do lựa chọn tỷ lệ lấy mẫu yêu thích của họ.


"Lưu ý rằng lý thuyết sử dụng các xung lý tưởng và các bộ lọc lý tưởng để mô tả mọi thứ (như tôi đã làm ở trên) nhưng mạch DAC thực tế sử dụng giữ không thứ tự ở đầu ra và các bộ lọc thực tế." Phóng to câu này, điều đó không có nghĩa là việc sử dụng các bộ lọc không lý tưởng trong giai đoạn DAC dẫn đến việc tái cấu trúc không hoàn hảo của đầu vào tương tự được lấy mẫu? Nói cách khác, việc sử dụng bộ lọc không lý tưởng có "tăng" tỷ lệ Nyquist không? (Tôi hoàn toàn mua các lập luận theo kinh nghiệm của phe chống 192, nhưng tôi có cảm giác rằng có một lỗ hổng trong lập luận lý thuyết xung quanh định lý Nyquist-Shannon với bộ phim không lý tưởng
user1202136 29/07/19

1
Câu trả lời lý thuyết là như đã nêu ở trên. Đến với lập luận thực tiễn; đúng là để dễ dàng thiết kế các bộ lọc tương tự (cắt sắc nét), có thể sử dụng quá mức đầu vào (và đầu ra của bộ lọc). Và vâng, một hệ thống như vậy dự kiến ​​sẽ tạo ra âm thanh ít bị biến dạng hơn. Nhưng không có gì tâm lý ở đây. Chỉ cần thiết kế bộ lọc. Luận điểm về việc liệu các nội dung trên 20 kHz được thêm bất kỳ giá trị cho âm thanh (hearable hoặc có liên quan) là kiến thức của tôi không . Vì vậy, bạn sẽ được hưởng lợi từ việc dễ dàng thiết kế bộ lọc, có thể nhận được, đầu ra ít biến dạng hơn. Và nó được đấy.
Fat32

2
Nó có thể gây ngạc nhiên nhưng nếu DAC có Zero Order Hold, quang phổ đầu ra không phẳng mà đã bị biến dạng bởi đường bao chân. Nó được gọi là hiệu ứng khẩu độ. Nó làm giảm tần số cao. Nó có thể được bù ở một mức độ nào đó với bộ lọc tái tạo tương tự giúp tăng tần số cao. Một lần nữa một lý do khác để tăng mẫu 48kHz lên 192kHz tại DAC để băng thông âm thanh 20kHz nằm xa tốc độ lấy mẫu đầu ra của DAC. Bất kỳ bộ lọc, tương tự hoặc kỹ thuật số, không cần phải lý tưởng và hoàn hảo, chỉ đủ tốt để bạn không thể nghe thấy những người không lý tưởng (hoặc đo lường chúng).
Justme

@Justme vâng, đáp ứng cường độ chân thành ngược được đề xuất để sửa méo phổ ... Tốc độ lấy mẫu cao hơn sẽ giúp bạn dễ nhận ra hơn, với chi phí cho khả năng xử lý và lưu trữ nhiều hơn (hoặc chuyển đổi lên / xuống có thể tạo ra nhiều biến dạng hơn bộ lọc tái tạo nonideal sẽ làm! ;-))
Fat32
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.