Câu trả lời đơn giản là một hệ thống đáp ứng tần số phẳng được xây dựng với op-amps để điều chỉnh phản hồi của trình điều khiển sẽ nhất thiết phải có đáp ứng pha rất không phẳng trong dải thông. Độ không phẳng này có nghĩa là tần số thành phần của âm thanh thoáng qua trở nên chậm trễ không đồng đều, dẫn đến méo tạm thời, điều này ngăn cản việc nhận dạng thành phần âm thanh phù hợp, có nghĩa là có thể nhận ra ít âm thanh khác biệt hơn.
Do đó, nó có vẻ khủng khiếp. Như thể tất cả âm thanh phát ra từ một quả bóng mờ nằm chính giữa hai tai.
Vấn đề HRTF trong câu trả lời ở trên chỉ là một phần của vấn đề này - vấn đề khác là mạch miền tương tự có thể thực hiện được chỉ có thể có đáp ứng thời gian nguyên nhân và để điều chỉnh đúng trình điều khiển, người ta cần một bộ lọc chính.
Điều này có thể được xấp xỉ bằng kỹ thuật số với bộ lọc Phản hồi xung hữu hạn phù hợp với trình điều khiển, nhưng điều này đòi hỏi độ trễ thời gian nhỏ, đủ để khiến các bộ phim trở nên không đồng bộ.
Và có vẻ như nó đến từ trong đầu bạn, trừ khi HRTF cũng được thêm lại.
Vì vậy, nó không đơn giản như vậy sau tất cả.
Để tạo ra một hệ thống "trong suốt", bạn không chỉ cần một dải thông phẳng trên phạm vi nghe của con người, bạn cũng cần một pha tuyến tính - một âm mưu trì hoãn nhóm phẳng - và có một số bằng chứng cho thấy rằng pha tuyến tính này cần để tiếp tục với tần suất cao đáng ngạc nhiên để tín hiệu định hướng không bị mất.
Điều này rất dễ xác minh bằng thử nghiệm: Mở một .wav một số nhạc bạn quen thuộc trong trình chỉnh sửa tệp âm thanh như Audacity hoặc snd và xóa một mẫu 44100 Hz từ chỉ một kênh và căn chỉnh lại kênh khác sao cho kênh đầu tiên bây giờ mẫu xảy ra với kênh thứ hai của kênh đã chỉnh sửa và phát lại.
Bạn sẽ nghe thấy một sự khác biệt rất đáng chú ý, mặc dù sự khác biệt là thời gian trễ chỉ là 1/44100 của một giây.
Xem xét điều này: âm thanh đi khoảng 340 mm / ms, vì vậy ở 20 kHz, đây là lỗi thời gian cộng với trừ đi một độ trễ mẫu, hoặc 50 micro giây. Đó là hành trình âm thanh 17 mm, nhưng bạn có thể nghe thấy sự khác biệt với thiếu 22,67 micro giây, tức là chỉ 7,7 mm hành trình âm thanh.
Sự cắt đứt tuyệt đối của thính giác con người thường được coi là khoảng 20 kHz, vậy chuyện gì đang xảy ra?
Câu trả lời là các bài kiểm tra thính giác được thực hiện với các âm kiểm tra, chủ yếu chỉ bao gồm một tần số tại một thời điểm, trong một thời gian khá dài ở mỗi phần của bài kiểm tra. Nhưng tai trong của chúng ta bao gồm một cấu trúc vật lý thực hiện một FFT các loại âm thanh trong khi phơi bày các nơ-ron với nó, để các nơ-ron ở các vị trí khác nhau tương quan với các tần số khác nhau.
Các nơ-ron riêng lẻ chỉ có thể bắn lại rất nhanh, vì vậy trong một số trường hợp, một số ít được sử dụng hết lần này đến lần khác ... nhưng điều này chỉ hoạt động lên đến khoảng 4 kHz hoặc hơn ... Đó là đúng nơi chúng ta nhận thức về giai điệu kết thúc. Tuy nhiên, không có gì trong não để ngăn chặn một nơ-ron bắn ra bất cứ lúc nào nó cảm thấy quá nghiêng, vậy tần số cao nhất là vấn đề gì?
Vấn đề là sự khác biệt pha nhỏ giữa hai tai là có thể cảm nhận được, nhưng thay vì cách chúng ta xác định âm thanh (bằng cấu trúc quang phổ của chúng) thì nó ảnh hưởng đến cách chúng ta cảm nhận hướng của chúng. (mà HRTF cũng thay đổi!) Mặc dù có vẻ như nó sẽ bị "loại bỏ" khỏi phạm vi nghe của chúng tôi.
Câu trả lời là điểm -3dB hoặc thậm chí -10dB vẫn còn quá thấp - bạn cần phải đi đến khoảng -80 dB để có được tất cả. Và nếu bạn muốn xử lý âm thanh lớn cũng như yên tĩnh, thì bạn cần phải giảm xuống mức tốt hơn -100 dB. Điều mà một bài kiểm tra nghe một giai điệu khó có thể xảy ra, phần lớn là do các tần số như vậy chỉ "đếm" khi chúng đến cùng pha với các sóng hài khác của chúng như là một phần của âm thanh thoáng qua - năng lượng của chúng trong trường hợp này cộng lại, đạt đủ nồng độ để kích hoạt phản ứng thần kinh, mặc dù khi các thành phần tần số riêng lẻ bị cô lập, chúng có thể quá nhỏ để đếm.
Một vấn đề khác là dù sao chúng ta cũng liên tục bị bắn phá bởi nhiều nguồn tiếng ồn siêu âm, có lẽ phần lớn là do các nơ-ron bị hỏng ở tai trong của chúng ta, bị tổn thương do mức âm thanh quá mức ở một số thời điểm trước trong cuộc sống. Thật khó để phân biệt âm đầu ra bị cô lập của bài kiểm tra nghe qua tiếng ồn "cục bộ" lớn như vậy!
Do đó, điều này đòi hỏi thiết kế hệ thống "trong suốt" phải sử dụng tần số thông thấp cao hơn nhiều để có không gian cho thông thấp của con người mờ dần (với điều chế pha riêng mà não của bạn đã được "hiệu chỉnh" trước hệ thống điều chế pha bắt đầu thay đổi hình dạng của các quá độ và dịch chuyển chúng theo thời gian để não không thể nhận ra chúng thuộc về âm thanh nào nữa.
Với tai nghe, việc chế tạo chúng để có một trình điều khiển băng thông rộng duy nhất có đủ băng thông, và dựa vào đáp ứng tần số tự nhiên rất cao của trình điều khiển 'không quan tâm' để tránh biến dạng theo thời gian. Điều này hoạt động tốt hơn nhiều với tai nghe, vì khối lượng nhỏ của trình điều khiển cho vay tốt cho tình trạng này.
Lý do cần tuyến tính pha bắt nguồn sâu xa trong tính đối ngẫu của miền tần số miền thời gian, đó là lý do bạn không thể xây dựng bộ lọc độ trễ bằng 0 có thể "hoàn toàn chính xác" cho bất kỳ hệ thống vật lý thực nào.
Lý do "độ tuyến tính pha" quan trọng và không phải là "độ phẳng pha" là bởi vì độ dốc tổng thể của đường cong pha không thành vấn đề - bởi tính hai mặt, bất kỳ độ dốc pha nào cũng tương đương với độ trễ thời gian không đổi.
Tai ngoài của mọi người có hình dạng khác nhau và do đó, chức năng chuyển khác nhau xảy ra ở các tần số hơi khác nhau. Bộ não của bạn đã quen với những gì nó có, với những cộng hưởng riêng biệt. Nếu bạn sử dụng sai, nó thực sự sẽ nghe có vẻ tệ hơn, vì các hiệu chỉnh mà bộ não của bạn đã sử dụng sẽ không còn tương ứng với các chức năng chuyển của tai nghe, và bạn sẽ có một điều tồi tệ hơn là thiếu sự hủy bỏ cộng hưởng - bạn sẽ có gấp đôi số cực / số không cân bằng làm xáo trộn độ trễ pha của bạn và hoàn toàn xáo trộn sự chậm trễ của nhóm và thành phần đến các mối quan hệ thời gian.
Nghe có vẻ không rõ ràng và bạn sẽ không thể tạo ra hình ảnh không gian được mã hóa bởi bản ghi.
Nếu bạn thực hiện bài kiểm tra nghe A / B mù, mọi người sẽ chọn tai nghe không bị lỗi mà ít nhất là không làm cho nhóm bị chậm trễ quá nhiều, để bộ não của họ có thể tự phục hồi chúng.
Và đây thực sự là lý do tại sao tai nghe hoạt động không cố gắng cân bằng. Thật khó để có được đúng.
Đó cũng là lý do tại sao chỉnh sửa phòng kỹ thuật số là điểm thích hợp: Bởi vì sử dụng nó đúng cách đòi hỏi phải đo thường xuyên, khó thực hiện và không thể thực hiện được và điều mà người tiêu dùng thường không muốn biết.
Chủ yếu là do các cộng hưởng âm thanh trong phòng được điều chỉnh, phần lớn là một phần của phản hồi âm trầm, liên tục thay đổi khi áp suất không khí, nhiệt độ và độ ẩm thay đổi, do đó thay đổi tốc độ âm thanh một chút, do đó thay đổi cộng hưởng từ những gì chúng là khi phép đo được thực hiện.