Chất lượng âm thanh của tôi phải là gì?


33

Âm thanh và chất lượng của nó là một cái gì đó giống như tôn giáo. Câu chuyện không bao giờ kết thúc.

Mọi người sẽ nói rằng MP3 320kbps là không mất mát, trong khi các chuyên gia sẽ nói rằng bất kỳ MP3 nào là tào lao, nhưng cuối cùng, không ai sẽ nghe thấy sự khác biệt trong kết quả ... trừ khi họ ở trong ngành công nghiệp âm nhạc trong 20 năm +.

Định dạng tốt nhất cho trò chơi video là gì và những thuộc tính nào là đủ (Hertz, bitrate, v.v.), giả sử rằng MP3 320kbps là "nặng"?

Có thể một hoặc hai ví dụ, làm thế nào một số tiêu đề AAA hoạt động với âm thanh của chúng.


3
Các chuyên gia nghe thấy sự khác biệt giữa MP3 320kbps và ghi âm không mất dữ liệu thường có một thiết lập hi-fi (rất) tốn kém cho phép họ thậm chí nghe thấy những khác biệt này. Không phải thứ bạn có trên PC hoặc thiết bị di động thông thường. Ngoài ra chơi một trò chơi là một cái gì đó khác với nghe nhạc. Có những thứ khác mà bộ não của bạn đang bận rộn hơn là suy nghĩ về chất lượng âm thanh phụ;)
bummzack

2
@bummzack, vâng, miễn là chất lượng âm thanh không tệ đến mức gây mất tập trung. Đôi khi, tôi sẽ tìm thấy các trò chơi có hiệu ứng âm thanh thực sự kém có tiếng rít nền hoặc bị nén hoàn toàn. Tuy nhiên, việc đặt hầu hết mọi cân nhắc vào chất lượng âm thanh có thể sẽ tránh được điều này. Tôi khuyên bạn nên kiểm tra các mẫu của bạn trên một cái gì đó với âm thanh cao cấp hơn. Mã hóa âm thanh của bạn không phải là yếu tố duy nhất dẫn đến âm thanh tốt.
dùng606723

Chỉ có lý do tôi chống lại MP3 là vì nó lặp lại khủng khiếp.
Sidar

Câu trả lời:


63

Cập nhật tháng 7 năm 2017

Nếu bạn đang sử dụng Unity hoặc một công cụ lớn khác có hệ thống quản lý tài sản, đừng yêu cầu Ogg Vorbis từ các nhà thiết kế và nhà soạn nhạc âm thanh của bạn. Nhận WAV hoặc AIFF.

Unity và Unreal được cấu trúc để hoạt động với số lần thoát chất lượng cao và sau đó áp dụng cài đặt nén trên mỗi nền tảng. Có tài sản nguồn là Ogg hoặc Mp3 có nghĩa là bạn đang nén hai lần âm thanh và giới thiệu các tạo phẩm bổ sung không có lợi.

Nếu bạn thấy rằng bắt đầu từ ogg hoặc mp3 làm giảm kích thước bản dựng của bạn, đó không phải là lý do chính đáng. Điều đó có nghĩa là bạn đang xuất trước với các cài đặt nén khác với mức bạn đã áp dụng trong Unity / Unreal. Có hành quyết không? Có, nhưng bạn sẽ không tìm kiếm câu trả lời này nếu bạn biết khi những ngoại lệ đó được áp dụng.

Nếu bạn đang nén trước để giảm kích thước repo của mình, hãy sử dụng LFS, sử dụng hệ thống kiểm soát phiên bản tập trung hoặc cười toe toét và chịu đựng nó.


TL; DR

  1. Vâng , MP3 320k âm thanh tuyệt vời. NHƯNG . . .
  2. Không sử dụng MP3, sử dụng Ogg Vorbis ở 44.1kHz, chất lượng 6 cho âm nhạc. Đối với hiệu ứng âm thanh, chỉ cần sử dụng WAV 16 / 44.1 trừ khi bạn thực sự cảm thấy cần giảm mỡ.
  3. Nếu bạn phải sử dụng MP3, chẳng hạn như trong Flash, hãy thử sử dụng 192k-256k (VBR 1 hoặc 2), nhưng bạn có thể phải giải quyết với giá 128k. Đừng xuống thấp hơn 128k (VBR 6).

Câu trả lời thực sự

Mọi người sẽ nói rằng MP3 320kbps là không mất mát, trong khi các chuyên gia sẽ nói rằng bất kỳ MP3 nào là tào lao, nhưng cuối cùng, không ai sẽ nghe thấy sự khác biệt trong kết quả ... trừ khi họ ở trong ngành công nghiệp âm nhạc trong 20 năm +.

Âm thanh được mã hóa trong MP3, bất kể chất lượng mã hóa, luôn luôn bị mất. Đây là một codec nhận thức, và do đó hoạt động bằng cách mã hóa các thuộc tính của âm thanh theo thời gian trong ~ 1152 khối mẫu ở dạng nén, từ đó các mẫu không nén có thể được ngoại suy bởi bộ giải mã. Mục tiêu của nó không phải là tái tạo chính xác âm thanh gốc, chỉ cung cấp một âm thanh "đủ tốt".

Tuy nhiên, như bạn đã nói, 320kbps âm thanh rất tốt. Nó thường được coi là tốt hoặc tốt hơn chất lượng CD. Tuy nhiên, vẫn không thể tái tạo hoàn hảo các mẫu ban đầu của WAV không nén được mã hóa dưới dạng MP3 320kbps.

Nói chung Ogg Vorbis là một định dạng tốt hơn MP3. Nói chung, họ đồng ý cung cấp cho bạn chất lượng tốt hơn cho cùng một tệp có kích thước và không giống như MP3 có thể dễ dàng lặp lại một cách liền mạch. Các đoạn 1152 mẫu mà MP3 sử dụng để mã hóa âm thanh thường sẽ giữ im lặng ở đầu và cuối âm thanh. Không phải là một vấn đề lớn đối với các hiệu ứng âm thanh cơ bản, nhưng là một vấn đề lớn đối với các vòng lặp âm nhạc.

Flash IDE xoay quanh vấn đề này trong quá trình xuất .swf, nó loại bỏ sự im lặng bằng tay. Những người sử dụng âm thanh phát trực tuyến (hoặc mxmlc thuần túy) đạt được vòng lặp thông qua SampleDataEvent và thả mẫu thủ công hoặc tiền xử lý tệp MP3 (xem blog của Andre Michelletiện ích mp3loop CompuPhase )

Ngoài ra, sử dụng bộ giải mã MP3 về mặt kỹ thuật đòi hỏi bạn phải có giấy phép bằng sáng chế để sử dụng (vì bằng sáng chế MP3 thuộc sở hữu của Techncolor, Fraunhofer và những người khác). Rõ ràng hàng tấn người đã phát hành các trò chơi phần mềm miễn phí sử dụng MP3, nhưng tốt nhất là không nên loay hoay với điều đó.

Định dạng tốt nhất cho trò chơi video là gì và những thuộc tính nào là đủ (Hertz, bitrate, v.v.), giả sử rằng MP3 320kbps là "nặng"?

Có thể một hoặc hai ví dụ, làm thế nào một số tiêu đề AAA hoạt động với âm thanh của chúng.

Điều đó phụ thuộc: Nền tảng mục tiêu của bạn là gì, bạn đang sử dụng công nghệ nào khác, cách bạn phân phối trò chơi của mình và bạn đang theo phong cách nào? Tôi sẽ chia nó thành một vài loại dựa trên nền tảng, công nghệ và thẩm mỹ.

Các tiêu đề PC và Console cao cấp

Các trò chơi AAA sẽ có chất lượng sản xuất hàng đầu, vì vậy chúng ghi và sản xuất tài sản không nén 24bit / 48kHz (cũng là tiêu chuẩn cho hậu kỳ phim). Các tiêu đề với tham vọng ít hơn một chút so với Battlefield 3 có thể ghi và sản xuất trong 16 / 44.1, đây là tiêu chuẩn chính thức cho âm thanh chất lượng CD.

Tất nhiên, bạn không thể gửi một loạt 24/48 WAV không nén với một trò chơi, nó sẽ quá lớn. Vì vậy, cuối cùng phải có một số loại nén xảy ra. Nói chung, nguyên tắc chung là, nếu đó là hiệu ứng âm thanh nhanh như tiếng súng (như tiếng súng của Portal 2 trong câu trả lời của Sprunth), bạn có thể để nó ở dạng WAV, có thể giảm tốc độ mẫu tùy theo tần số (xem phần Định lý Nyquist , âm thanh được tạo thành từ nội dung tần số thấp có thể được mã hóa ở tốc độ lấy mẫu thấp hơn). Đối với âm nhạc, thực sự không có cách nào để nén. Ogg Vorbis với chất lượng CD là con đường để đi (44,1kHz, chất lượng 5-6 hoặc cao hơn).

Ngoài ra, các trò chơi AAA thường sẽ sử dụng một công cụ trung gian để nén, hoặc là một công cụ nội bộ hoặc phần mềm trung gian âm thanh như FMOD hoặc Wwise. Cách thức hoạt động trong FMOD và Wwise là bạn nhập hầu hết mọi thứ dưới dạng 16 / 44.1 hoặc 24/48 WAV (hoặc, nếu âm thanh là tất cả nội dung tần số thấp, nó có thể được nhập với tốc độ lấy mẫu thấp hơn), sau đó cung cấp cho FMOD hệ số nén cho từng nội dung, chọn mã hóa như ADPCM, MP3 hoặc Ogg Vorbis.

FMOD thực sự gần đây đã bỏ hỗ trợ mã hóa tài sản trong các soundbanks bạn xuất từ ​​FMOD Designer (tệp .fsb) vì Ogg Vorbis ủng hộ một codec mới từ Xiph có tên là CELT . Ogg Vorbis có thể hơi khó khăn với CPU, vì vậy CELT đang được phát triển để cung cấp một giải pháp thay thế. Bạn có thể tải các tệp trực tiếp, nhưng không còn sử dụng để mã hóa từ ứng dụng Designer.

Nhân tiện, đây là một liên kết thú vị về âm thanh của Battlefield Bad Company cũng được đưa vào một chút. DICE khá nhiều đi đầu trong công nghệ âm thanh trong các trò chơi, vì vậy đây là một loạt tốt để nghiên cứu.

Ngoài ra, liên quan đến âm thanh vòm là vấn đề mono vs stereo. Chỉ trong trường hợp bạn không biết, tất cả các hiệu ứng âm thanh của bạn phải là đơn âm, trừ khi một số trong số chúng thực sự sử dụng hiệu ứng lia máy. Âm thanh nổi lúng túng trong không gian 3d và bạn có thể xoay âm thanh trong mã để đặt chúng vào môi trường 2d.

Các tiêu đề hơi ít, cao cấp, các trò chơi Indie

Rõ ràng điều này có thể rất khác nhau. Nhìn lướt qua cho thấy Frozen Synapse sử dụng hoàn toàn các tệp Ogg Vorbis, cho cả hiệu ứng âm thanh và âm nhạc. Mặt khác, Dungeons of Dredmor tuân theo sơ đồ của Ogg Vorbis cho âm nhạc và WAV 16 / 44.1 cho hiệu ứng âm thanh.

Cách tiếp cận Dungeons của Dredmor là thích hợp hơn. Ngay cả được lưu trữ dưới dạng WAV không nén, hiệu ứng âm thanh nói chung đủ ngắn để chúng không chiếm nhiều dung lượng và bạn tiết kiệm được rất nhiều chu kỳ CPU mà không phải giải mã chúng. Bạn muốn có thể nhanh chóng tải một hiệu ứng âm thanh vào bộ nhớ và phát nó. Nếu bạn mã hóa hiệu ứng âm thanh của mình trong Ogg Vorbis, sẽ có khả năng bị trễ rất ít trước khi người chơi nghe thấy hiệu ứng âm thanh của bạn lần đầu tiên.

Trò chơi trình duyệt, HTML5 và Flash (với một chút di động)

Âm thanh HTML5 là một mớ hỗn độn. Bạn phải cung cấp cả phiên bản ogg và MP3 cho âm thanh của mình. Mã hóa với chất lượng cao nhất bạn có thể mà không cần người dùng hoành hành trong thời gian tải dài. Đối với MP3, đừng xuống dưới 128k, nó đủ tệ ở mức 128.

Flash chỉ chấp nhận MP3 16bit / 44.1kHz trừ khi bạn thực hiện và viết bộ giải mã của riêng bạn cho một số định dạng khác (như bộ giải mã Ogg Vorbis thử nghiệm trong phòng thí nghiệm Alchemy). Trước đây, Flash có vấn đề với MP3 Tốc độ bit biến đổi, nhưng tôi chưa bao giờ gặp sự cố. Cài đặt chất lượng bạn chọn cho trò chơi Flash sẽ phụ thuộc vào mức độ bạn muốn .swf cuối cùng của bạn lớn đến mức nào.

Cập nhật: Như Tetrad đã đề cập , các trò chơi di động phải được xem xét với bộ nhớ và lưu trữ. Cách bạn mã hóa âm thanh cho các trò chơi di động giống như Flash, bạn muốn giữ lại chất lượng cao nhất có thể, nhưng cuối cùng bạn phải phù hợp với ngân sách bộ nhớ và lưu trữ. Trình theo dõi nhạc đặc biệt tốt nếu bạn có ngân sách lưu trữ chặt chẽ cho âm nhạc. Nói với nhà soạn nhạc của bạn để hạn chế bảng mẫu của mình và bạn có thể phù hợp với một tấn âm nhạc hơn trong trò chơi.

Hiệu ứng âm thanh và âm nhạc "8-bit" hoặc Chiptune

Hầu hết các trò chơi sẽ làm những gì Frozen Synapse và Dungeons of Dredmor làm. Tuy nhiên, có lẽ bạn có thể thoát khỏi việc giảm tốc độ lấy mẫu và độ sâu bit. Nó không chỉ có thể phù hợp với thẩm mỹ mà bạn đang đi, mà còn có thể giúp bạn tiết kiệm không gian.

Ngoài ra, nhạc theo dõi thường lưu trữ các mẫu ở tốc độ mẫu thấp, cứ để nó xảy ra.


Hiệu ứng âm thanh giải thích. Giai đoạn.
joltmode

1
Bạn có liên kết cho khiếu nại rằng FMOD đang bỏ hỗ trợ cho Ogg Vorbis không?
Kylotan

1
Tôi nên làm rõ, họ đã không bỏ tất cả sự hỗ trợ cho Ogg Vorbis. Nó không còn khả dụng khi chọn codec cho tài sản trong FMOD Designer (câu trả lời được cập nhật để phản ánh điều này). Họ đã không đưa ra bất kỳ thông báo lớn nào về nó, tôi phát hiện ra khi tôi đi thử và mã hóa một số nhạc trong một ngân hàng âm thanh là Ogg Vorbis. Bài đăng KVR có đề cập đến nó: kvraudio.com/news/ mài Nhưng bạn có thể dễ dàng tải xuống FMOD Designer và tự mình xem.
michael.bartnett

1
@emddudley Nếu âm thanh nguồn của bạn là một thứ gì đó như 48bit / 196kHz thì có thể hình dung bạn có thể nén nó theo cách giữ lại lượng thông tin tần số và biên độ điên rồ và như vậy có độ trung thực cao hơn âm thanh CD, được cố định ở mức 16 bit / 44,1kHz.
michael.bartnett

1
@DavidDimalanta WAV thường lớn hơn nhiều so với MP3, nhưng với ưu điểm là bạn không cần phải giải mã nó, chỉ cần đặt nó vào bộ nhớ. Nhạc nền thường được nén vì lý do này, vì âm thanh được lưu trữ sẽ dài hơn, kích thước tăng lên nhanh chóng. MP3 có vấn đề với việc cấp phép và lặp liền mạch như tôi đã đề cập trong asnwer, vì vậy tốt nhất nên tránh nó nếu bạn có thể.
michael.bartnett

14

Làm thế nào ngành công nghiệp làm việc với âm thanh, tôi không chắc chắn.

Nhưng nhìn qua các trò chơi của tôi, hầu hết trong số họ gói nó trong một số tệp dữ liệu hoặc cách khác.

Dưới đây là một vài bit âm thanh tôi có thể kéo:

  • Deus Ex: Human Revolution (Menu chính [bài hát]) mp3 44100Hz 320kb / s
  • Cổng thông tin 2 (4000 độ Kelvin [bài hát]) mp3 44100Hz 128kb / s
  • Portal 2 (Portal Gun fizzle [soundfx]) wav 44100Hz 16 bit / mẫu
  • Phe rủi ro ("NORMALLOOP_SEGMENT03" [soundfx]) ogg 48000Hz 128kb / s
  • Cuộc gọi của Juarez Bound in Blood ("COJ2_Attack_16" [bài hát]) ogg 48000Hz 350kb / s
  • Trình điều khiển Zombie ("Pick_money" [soundfx], "main_menu" [bài hát]) ogg 44100Hz 128kb / s
  • Xung đột X3 Terran ("00025" [bài hát]) mp3 22050Hz 56kb / s
  • Bejeweled 3 ("Duyên hải" [môi trường xung quanh]) ogg 44100Hz 96kb / s

Vì tôi không thể giải nén bất kỳ tệp dat, vv nào (ngoại trừ GCF của Portal 2), kết quả có thể không hiển thị phổ trên thị trường. Tôi đã cố gắng đưa cho bạn một mẫu trò chơi và những trò chơi không đóng gói âm thanh của chúng dường như cho kết quả tương tự.


4000 Degrees Kelvinlà từ Cổng thông tin đầu tiên, không phải thứ hai.
val nói Phục hồi Monica

6

Theo kinh nghiệm của tôi (chủ yếu là các tựa game di động), chất lượng âm thanh phải càng thấp càng tốt mà không gây ra các tác dụng phụ tiêu cực để bạn có nhiều bộ nhớ hơn cho những thứ khác.

Hãy nhớ rằng chỉ vì có nén liên quan không nhất thiết có nghĩa là chất lượng của bạn quá thấp. Khán giả của bạn sẽ không thực hiện so sánh cạnh nhau với âm thanh cơ bản giống như bạn, vì vậy nếu họ thiếu thứ gì đó thông qua việc nén mất mát, họ thường sẽ không biết về nó.

Ví dụ, bạn phải tự hỏi liệu có lý do nào để sử dụng âm thanh nổi hoặc âm nhạc không. Là hiệu ứng nó mang lại cho bạn giá trị gần gấp đôi chi phí? Đối với âm nhạc, tùy thuộc vào cách tác giả, câu trả lời có thể là có. Một số động cơ thậm chí không hỗ trợ nguồn âm thanh nổi cho hiệu ứng âm thanh. Đó là một cách nghĩ.

Trường hợp đó là rất chủ quan, tất nhiên. Có những câu trả lời khác đi vào quy tắc cụ thể hơn.

Điều quan trọng là phải có các tiêu chuẩn, thiết lập chúng sớm và cố gắng tuân thủ nó. Nếu bạn là tác giả âm nhạc cho một trò chơi và phải giảm một nửa tốc độ bit của nó để phù hợp với bộ nhớ, thì bạn sẽ trở nên tồi tệ hơn nhiều so với việc bạn đặt mức chất lượng thấp ở vị trí đầu tiên.


4

Nếu bạn đang nhắm mục tiêu một nền tảng cụ thể - iPhone, Xbox 360, PS3 - bạn nên xem xét liệu phần cứng có bộ giải mã âm thanh hay không. Nếu vậy, bạn nên sử dụng nó. Bạn sẽ tiết kiệm thời gian CPU (và tuổi thọ pin!) Bằng cách giảm tải âm thanh và bạn sẽ có thể tận dụng tối đa các API của nền tảng đó. Quan trọng hơn, khả năng tăng tốc phần cứng sẽ phụ thuộc vào âm thanh của bạn ở một định dạng cụ thể - vì vậy lựa chọn của bạn sẽ được thực hiện.

Tuy nhiên, nếu bạn đang nhắm mục tiêu PC, thì các tùy chọn của bạn sẽ đa dạng hơn. Tôi chỉ cần chọn định dạng với kích thước tệp nhỏ nhất vẫn nghe tốt cho đôi tai của bạn và chạy với nó.


Bạn có thể cụ thể hơn một chút về các bảng điều khiển khác nhau không?
Quazi Irfan

Ý tưởng chính là nhắm mục tiêu vào PC, các hệ điều hành khác nhau. * NIX (bao gồm Mac), Windows. Nhưng sau này sẽ mở rộng sang iOS, Android. Bảng điều khiển sang một bên cho bây giờ.
joltmode

4

Nó phụ thuộc vào những gì sẽ 'che khuất' mã hóa mất mát - nếu bạn nhìn vào câu trả lời của Sprunth, xu hướng chung cho âm nhạc là chất lượng cao cho menu và chất lượng thấp cho âm nhạc trong trò chơi. Lý do có lẽ là vì:

  • Trong các menu, âm thanh duy nhất đang phát là âm nhạc - và do đó là 'tập trung'; bạn sẽ nhận thấy bitrate thấp hơn mất.
  • Trong trò chơi, bạn có các hiệu ứng âm thanh (tiếng nổ, v.v.) ngoài âm nhạc được phát ở mức âm lượng thấp hơn; có nghĩa là bạn sẽ không nhận thấy sự mất mát về chất lượng.
  • Cuộc gọi của các nhà phát triển Juarez dường như thích quá mức cần thiết.

Cuối cùng, một xu hướng khác từ câu trả lời của ông là hầu hết các hiệu ứng là 44KHz / 16 bit; nhưng một số trò chơi cũ hơn cho phép bạn chạy ở tốc độ 22KHz / 16 bit (quality Chất lượng âm thanh ') - trong trường hợp card âm thanh của bạn không thể xử lý tốc độ mẫu cao hơn.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.