Tại sao chúng tôi chọn 44,1 kHz làm tốc độ lấy mẫu?


21

Tai của mọi người có thể nghe thấy âm thanh có tần số dao động từ 20 Hz đến 20 kHz. Dựa trên định lý Nyquist, tốc độ ghi tối thiểu phải là 40 kHz. Có phải đó là lý do để chọn 44,1 kHz?


4
Nó được chọn để tương thích với tốc độ khung hình video. Xem en.wikipedia.org/wiki/44,100_Hz#Why_44.1_kHz.3F
endolith

Các tần số trên khoảng 12-15k thêm ít hoặc không có giá trị. Hầu hết những người trên 40 tuổi sẽ có ít hữu ích. Khả năng nghe trên mức đó.
Chris Heath

Câu trả lời:


32

Đúng là, giống như bất kỳ quy ước nào, sự lựa chọn 44,1 kHz là một tai nạn lịch sử. Có một vài lý do lịch sử khác.

Tất nhiên, tốc độ lấy mẫu phải vượt quá 40 kHz nếu bạn muốn âm thanh chất lượng cao với băng thông 20 kHz.

Đã có cuộc thảo luận về việc tạo ra 48,0 kHz (nó phù hợp độc đáo với 24 khung hình / giây và 30 khung hình / giây ở TV Bắc Mỹ), nhưng với kích thước vật lý là 120 mm, có giới hạn về số lượng dữ liệu CD có thể giữ và cho rằng cần có sơ đồ phát hiện và sửa lỗi và yêu cầu một số dữ liệu dư thừa, lượng dữ liệu logic mà CD có thể lưu trữ (khoảng 700 MB) là khoảng một nửa lượng dữ liệu vật lý. Với tất cả những điều đó, với tốc độ 48 kHz, chúng tôi được cho biết rằng nó không thể giữ toàn bộ số 9 của Beethoven, nhưng nó có thể giữ toàn bộ số 9 trên một đĩa với tốc độ chậm hơn một chút. Vì vậy, 48 kHz là ra.

Tuy nhiên, tại sao 44.1 chứ không phải 44.0 hoặc 45.0 kHz hoặc một số số tròn đẹp?

Sau đó, vào thời điểm đó, đã tồn tại một sản phẩm vào cuối những năm 1970 được gọi là Sony F1 được thiết kế để ghi âm thanh kỹ thuật số vào băng video có sẵn (Betamax, không phải VHS). Đó là ở mức 44,1 kHz (hay chính xác hơn là 44.056 kHz). Vì vậy, điều này sẽ giúp bạn dễ dàng chuyển các bản ghi, mà không cần lấy mẫu lại và nội suy, từ F1 sang CD hoặc theo hướng khác.

Sự hiểu biết của tôi về cách thức đạt được điều đó là tốc độ quét ngang của TV NTSC là 15,750 kHz và 44,1 kHz chính xác là 2,8 lần. Tôi không hoàn toàn chắc chắn, nhưng tôi tin điều đó có nghĩa là bạn có thể có ba cặp mẫu âm thanh nổi trên mỗi dòng nằm ngang và cứ sau 5 dòng, bạn thường có 15 mẫu, có 14 mẫu cộng thêm một mẫu cho một số mẫu kiểm tra chẵn lẻ hoặc dự phòng trong F1. 14 mẫu cho 5 dòng giống như 2,8 mẫu trên mỗi dòng ngang và với 15.750 dòng mỗi giây, được đưa ra là 44.100 mẫu mỗi giây.

Bây giờ, kể từ khi TV màu được giới thiệu, họ phải giảm nhẹ tốc độ đường ngang xuống 15734 dòng mỗi giây. Sự điều chỉnh đó dẫn đến 44.056 mẫu mỗi giây trong Sony F1.


8

Hãy xem http://www1.cs.columbia.edu/~hgs/audio/44.1.html chẳng hạn. Bạn nên sử dụng tốc độ lấy mẫu hơn 40 kHz vì các bộ lọc khử răng cưa. Bạn nên có một số dự trữ về tần suất để ngăn chặn sự biến dạng tín hiệu do độ dốc phản hồi của bộ lọc. Giá trị thực tế 44,1 kHz được Sony corp đề xuất khi tiêu chuẩn ghi âm đang được thảo luận vào năm 1979. Họ đã sử dụng tốc độ này rộng rãi cho thời điểm đó.

Vì vậy, đó thường là lý do lịch sử.


6

Trong quá trình chuyển đổi sang các định dạng kỹ thuật số, âm thanh được lưu trữ ở dạng sóng giả video có thể được xem là đen hoặc trắng (đại diện cho định dạng nhị phân).

Tốc độ trường và cấu trúc được sử dụng bởi tiêu chuẩn truyền hình như sau đối với video 60 Hz: 245 dòng trên mỗi trường (không bao gồm 35 dòng trống đầu tiên). Với ba mẫu trên mỗi dòng tạo ra 60 x 245 x 3 = 44100 = 44,1 KHz.

Quy ước này sau đó đã được sử dụng cho định dạng CD, do những lo ngại về khả năng tương thích của thiết bị (thiết bị đầu tiên được sử dụng để sản xuất đĩa CD được sử dụng để sao chép CD là dựa trên video).

Nguồn: Nghệ thuật tái tạo âm thanh, tr. 228


nếu đó là những gì F1 làm, tôi phải nói "tôi đứng đúng". tôi giả sử F1 đã sử dụng các dòng trống.
robert bristow-johnson

xin chào, tôi chỉ đọc ở đây rằng "Mã hóa màu NTSC được sử dụng với tín hiệu truyền hình System M, bao gồm 30 / 1.001 (khoảng 29.97) khung hình video xen kẽ mỗi giây. Mỗi khung hình bao gồm hai trường, mỗi trường bao gồm 262,5 các dòng quét, với tổng số 525 dòng quét. 483 dòng quét tạo nên raster có thể nhìn thấy. Phần còn lại (khoảng trống dọc) cho phép đồng bộ hóa và truy xuất dọc. "
vì vậy, ngay cả 490 dòng sử dụng một số dòng trống (NTSC gốc).
robert bristow-johnson

0

Có vẻ như giới hạn Hearinig đối với con người có thể cao hơn nhiều so với 20kHz nếu nhìn từ góc độ phân giải thời gian "động" thay vì sóng hình sin tĩnh điển hình. Cũng có những nhận xét thú vị về biên độ giữa 20kHz và 22 kHz để lọc tái cấu trúc. Trên thực tế, đã có một công việc thú vị từ Peter Craven về bộ lọc được tối ưu hóa theo miền thời gian, lập luận cho ít nhất 96kHz để phát lại hi-fi.

Chân


tốt, có một cách để tìm hiểu. nó được gọi là thử nghiệm Blind AB . không cần phải là Double-Blind (nhưng thông thường là vậy). và xét nghiệm AB tốt hơn thử nghiệm ABX theo ý kiến ​​của tôi.
robert bristow-johnson

0

https://en.wikipedia.org/wiki/44,100_Hz#Why_44.1_kHz.3F Định lý lấy mẫu NyquistTHER Shannon nói rằng tần số lấy mẫu phải lớn hơn hai lần tần số tối đa mà người ta muốn tái tạo. Do phạm vi nghe của con người là khoảng 20 Hz đến 20.000 Hz, tốc độ lấy mẫu phải lớn hơn 40 kHz.

Ngoài ra, tín hiệu phải được lọc thông thấp trước khi lấy mẫu để tránh răng cưa. Mặc dù bộ lọc thông thấp lý tưởng sẽ vượt qua hoàn hảo các tần số dưới 20 kHz (không làm suy giảm chúng) và cắt hoàn toàn các tần số trên 20 kHz, nhưng về mặt lý thuyết, bộ lọc lý tưởng là không thể (về mặt lý thuyết là không cần thiết), do đó, trong thực tế, một dải chuyển tiếp là cần thiết, trong đó tần số bị suy giảm một phần. Dải chuyển tiếp này càng rộng thì càng dễ dàng và kinh tế hơn để tạo bộ lọc khử răng cưa. Tần số lấy mẫu 44,1 kHz cho phép dải chuyển tiếp 2.05 kHz.

Ngoài ra, 44.100 là tích của bình phương của bốn số nguyên tố đầu tiên (2 ^ 2 * 3 ^ 2 * 5 ^ 2 * 7 ^ 2) và do đó có nhiều yếu tố nhỏ hữu ích.


Vì vậy, nếu chúng ta thay đổi thời gian đơn vị của mình từ giây thành "farg" , tức là 1,001 giây, thì điều đó sẽ làm gì với 44100 và nhiều yếu tố nhỏ hữu ích của nó?
robert bristow-johnson

-2

Hãy xem [ http://batmobile.bloss.ilrt.org/audio-analysis-on-an-iphone để mô tả. Định lý .A được gọi là định lý lấy mẫu Nyquist nói rằng để lấy mẫu tín hiệu X Hz mà không làm giảm chất lượng đáng kể, bạn cần lấy mẫu với tần số gấp 2 lần. Giới hạn thính giác của con người là khoảng 20kHz, do đó đòi hỏi tốc độ mẫu xấp xỉ 40Khz. Đây là lý do tại sao các đĩa CD được lấy mẫu ở 44Khz. tức là mỗi giây ghi trong đĩa CD chứa 44.000 phép đo tần số cao nhất có thể có trong bản ghi.


Chà, không hẳn vì điều đó ...
jojek

Đó là một phần vì điều đó. Thật hiếm khi con người nghe được trên 20k, vì vậy, phạm vi audiophile khá cao trên 40kHz, tức là 42, 43, 44. nếu bạn bắn một ai đó với sóng hình sin lớn ở mức 22k, chỉ một đứa trẻ có cơ hội nghe thấy nó. dơi là 115kHz và một số cá heo ở 150kHz, ngoại trừ trong nước, âm thanh rõ hơn. Kiểm tra nhận thức tần số cao của bạn trực tuyến bằng các bản ghi âm ... tức là tại đây audiocheck.net/audiotests_frequencycheckhigh.php
com.p Hiểu được
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.