Lộ trình học tập cho người mới bắt đầu xử lý tín hiệu âm thanh


13

Tôi muốn bắt đầu học xử lý tín hiệu âm thanh. Có rất nhiều sách trực tuyến và các bài báo học thuật tất cả trong số đó dường như bỏ qua các nguyên tắc cơ bản của chủ đề.

Tôi muốn biết một lộ trình sơ bộ, có thể nói, phải tuân theo để học thành công việc xử lý tín hiệu âm thanh.

Tôi đã đọc rằng tính toán là bước đầu tiên trước khi bắt đầu với phân tích tín hiệu.

Tôi cảm thấy như phân tích tín hiệu âm thanh chỉ là một phần của kiến ​​thức tổng thể cần thiết. Trường hợp các chủ đề khác là lý thuyết âm nhạc, kỹ thuật âm thanh và lập trình.

Nếu tôi có thể yêu cầu những người có kiến ​​thức về lĩnh vực này đề xuất các bước có thể hướng tới việc hiểu cách phân tích và thao tác / tạo tín hiệu âm thanh.


Tôi đồng ý rằng một nền tảng trong tính toán (tối thiểu) sẽ rất quan trọng để bạn có cơ hội hiểu toán học mà bạn có thể gặp trong một văn bản hoặc khóa học lý thuyết tín hiệu và hệ thống. Tôi chắc chắn rằng bạn sẽ hít vào đó trước.
Jason R

1
Những slide này có thể giúp đỡ. Họ nhận được của bạn mặc dù một số điều cơ bản phi toán học / kỹ thuật về xử lý âm thanh và lập trình âm thanh. blog.bjornroche.com/2011/11/ Tờ
Bjorn Roche

Câu trả lời:



9

Tôi không nghĩ có bất kỳ điểm nào đi sâu vào sự phức tạp của DFT / FFT / IIR / FIR và sóng con mà không hiểu âm thanh cơ bản là gì và các cách biểu diễn âm thanh kỹ thuật số khác nhau là gì.

Âm thanh nói chung là gì (trong không khí, không phải nước hoặc các vật liệu khác):

  • Âm thanh được tạo thành từ sóng áp suất âm thanh
  • Chúng gây ra sự nén và hiếm của không khí
  • Những sóng này truyền ra ngoài từ điểm nguồn
  • Sóng có thể giao thoa với nhau gây ra các đỉnh và đáy
  • Sóng có thể được hấp thụ và phản xạ bởi các vật liệu

Âm thanh được biểu diễn bằng điện như thế nào:

  • Một micro và bộ tiền khuếch đại chuyển đổi sóng áp suất âm thanh thành tín hiệu điện
  • Thông thường tín hiệu này có cả điện áp dương và âm (như điện áp xoay chiều)
  • Băng từ lưu trữ những khác biệt này khi chúng xuất hiện, do đó thuật ngữ tương tự
  • Độ bão hòa xảy ra khi cường độ tín hiệu đầu vào bằng với giới hạn của hệ thống (không thể biểu diễn chính xác hơn nữa điện áp)
  • Việc cắt xén xảy ra khi tín hiệu đầu vào cao hơn mức có thể được biểu thị bởi hệ thống, do đó tín hiệu bị cắt (hoặc bị giới hạn ở các điểm cực)

Âm thanh được thể hiện bằng kỹ thuật số như thế nào:

  • Đầu tiên âm thanh phải được lấy mẫu bằng cách sử dụng ADC (bộ chuyển đổi tương tự sang số)
  • Lấy mẫu bao gồm đo điện tín hiệu định kỳ
  • Khoảng thời gian này được gọi là tốc độ mẫu và nó xác định tần số cao nhất có thể được biểu thị (giới hạn nyquist)
  • Giới hạn nyquist là tốc độ mẫu / 2 (càng gần đến giới hạn, tín hiệu càng được thể hiện kém hơn)
  • Bitrange xác định mức nhiễu sàn, (-96dB cho 16 bit so với -48dB cho 8 bit)
  • Một mẫu âm thanh 16 bit duy nhất có thể là giá trị (đã ký) trong khoảng từ -32768 đến 32767 (điều này có thể đại diện cho cả độ lệch âm và dương của tín hiệu tương tự)
  • Chỉ có 8 Bits được phép cho mỗi byte (về lưu trữ máy tính), do đó, mẫu 16 bit phải được biểu thị bằng ít nhất 2 byte
  • Thứ tự mà các byte này được lưu trữ được gọi là loại endian của chúng (lớn hay nhỏ)
  • Các mẫu âm thanh nổi yêu cầu một mẫu riêng cho từng kênh, một cho bên trái và một cho bên phải

Những cách khác nhau được sử dụng để lưu trữ âm thanh kỹ thuật số:

  • PCM (mã xung được điều chế) là cách lưu trữ âm thanh kỹ thuật số phổ biến nhất
  • Nhiều nén tồn tại để giảm lượng dữ liệu được sử dụng, một số bị mất, một số bị mất
  • Các tệp WAV không được nén và có thể là đơn âm hoặc âm thanh nổi (các mẫu xen kẽ)
  • Các tệp MP3 được nén, mất dữ liệu và sử dụng âm thanh học để đạt được tốc độ nén dữ liệu rất cao
  • Ngay cả phạm vi bit thấp nhất (1 bit) cũng có thể hữu ích tùy thuộc vào cách sử dụng của chúng, điển hình là thẻ quà tặng phát âm thanh được lưu trữ dưới dạng 1 bit

Làm thế nào để trở nên quen thuộc hơn với âm thanh trong lĩnh vực kỹ thuật số:

  • Làm và làm nhiều hơn nữa! Tải xuống một chương trình như audacity và tạo các tệp âm thanh khác nhau bằng cách sử dụng các tốc độ mẫu và dải bit khác nhau
  • Tạo tông màu sin / tam giác / vuông và răng cưa và nghe sự khác biệt
  • Tìm hiểu cách nghe sự khác biệt giữa các loại, chẳng hạn như tệp 8 bit 10KHz và tệp 16 bit 44.1KHz (chất lượng CD)
  • Thử nghiệm với các bộ lọc thông cao / thông thấp / băng thông và nghe sự khác biệt
  • Tín hiệu đẩy vượt quá giới hạn bão hòa của chúng để hiểu cách cắt ảnh hưởng đến tín hiệu âm thanh
  • Áp dụng phong bì cho các tín hiệu nếu phần mềm của bạn có khả năng này
  • Có một sự khác biệt giữa biến dạng không điều hòa và hài hòa, thử nghiệm với cả hai
  • Sử dụng biểu đồ phổ (FFT) để xem các tín hiệu này và các tín hiệu khác để làm quen với chúng
  • Sử dụng cả lô tuyến tính và lôgarit để thấy sự khác biệt
  • Downsample và upample signal và nghe cách điều này ảnh hưởng đến âm thanh
  • Sử dụng các phương pháp phối màu khác nhau (khi chuyển đổi phạm vi bit) và nghe thấy sự khác biệt

Điều này hy vọng sẽ mang đến cho bạn cảm giác về âm thanh được thể hiện bằng kỹ thuật số và sự khác biệt nghe như thế nào trước khi thử bất kỳ DSP nào. Việc phân tích FFT của bạn luôn dễ dàng hơn nếu bạn có thể nhận ra rằng bạn đã nhập tín hiệu 8 bit so với tín hiệu 16 bit hoặc tốc độ mẫu đã bị hỏng do tính toán sai trong biến đổi.


Cảm ơn câu trả lời. Tôi nhận thức được những điều này mặc dù và muốn tham gia vào khía cạnh mã hóa dsp của nó ngay bây giờ.
jarryd
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.