Cập nhật tháng 7 năm 2017
Nếu bạn đang sử dụng Unity hoặc một công cụ lớn khác có hệ thống quản lý tài sản, đừng yêu cầu Ogg Vorbis từ các nhà thiết kế và nhà soạn nhạc âm thanh của bạn. Nhận WAV hoặc AIFF.
Unity và Unreal được cấu trúc để hoạt động với số lần thoát chất lượng cao và sau đó áp dụng cài đặt nén trên mỗi nền tảng. Có tài sản nguồn là Ogg hoặc Mp3 có nghĩa là bạn đang nén hai lần âm thanh và giới thiệu các tạo phẩm bổ sung không có lợi.
Nếu bạn thấy rằng bắt đầu từ ogg hoặc mp3 làm giảm kích thước bản dựng của bạn, đó không phải là lý do chính đáng. Điều đó có nghĩa là bạn đang xuất trước với các cài đặt nén khác với mức bạn đã áp dụng trong Unity / Unreal. Có hành quyết không? Có, nhưng bạn sẽ không tìm kiếm câu trả lời này nếu bạn biết khi những ngoại lệ đó được áp dụng.
Nếu bạn đang nén trước để giảm kích thước repo của mình, hãy sử dụng LFS, sử dụng hệ thống kiểm soát phiên bản tập trung hoặc cười toe toét và chịu đựng nó.
TL; DR
- Vâng , MP3 320k âm thanh tuyệt vời. NHƯNG . . .
- Không sử dụng MP3, sử dụng Ogg Vorbis ở 44.1kHz, chất lượng 6 cho âm nhạc. Đối với hiệu ứng âm thanh, chỉ cần sử dụng WAV 16 / 44.1 trừ khi bạn thực sự cảm thấy cần giảm mỡ.
- Nếu bạn phải sử dụng MP3, chẳng hạn như trong Flash, hãy thử sử dụng 192k-256k (VBR 1 hoặc 2), nhưng bạn có thể phải giải quyết với giá 128k. Đừng xuống thấp hơn 128k (VBR 6).
Câu trả lời thực sự
Mọi người sẽ nói rằng MP3 320kbps là không mất mát, trong khi các chuyên gia sẽ nói rằng bất kỳ MP3 nào là tào lao, nhưng cuối cùng, không ai sẽ nghe thấy sự khác biệt trong kết quả ... trừ khi họ ở trong ngành công nghiệp âm nhạc trong 20 năm +.
Âm thanh được mã hóa trong MP3, bất kể chất lượng mã hóa, luôn luôn bị mất. Đây là một codec nhận thức, và do đó hoạt động bằng cách mã hóa các thuộc tính của âm thanh theo thời gian trong ~ 1152 khối mẫu ở dạng nén, từ đó các mẫu không nén có thể được ngoại suy bởi bộ giải mã. Mục tiêu của nó không phải là tái tạo chính xác âm thanh gốc, chỉ cung cấp một âm thanh "đủ tốt".
Tuy nhiên, như bạn đã nói, 320kbps âm thanh rất tốt. Nó thường được coi là tốt hoặc tốt hơn chất lượng CD. Tuy nhiên, vẫn không thể tái tạo hoàn hảo các mẫu ban đầu của WAV không nén được mã hóa dưới dạng MP3 320kbps.
Nói chung Ogg Vorbis là một định dạng tốt hơn MP3. Nói chung, họ đồng ý cung cấp cho bạn chất lượng tốt hơn cho cùng một tệp có kích thước và không giống như MP3 có thể dễ dàng lặp lại một cách liền mạch. Các đoạn 1152 mẫu mà MP3 sử dụng để mã hóa âm thanh thường sẽ giữ im lặng ở đầu và cuối âm thanh. Không phải là một vấn đề lớn đối với các hiệu ứng âm thanh cơ bản, nhưng là một vấn đề lớn đối với các vòng lặp âm nhạc.
Flash IDE xoay quanh vấn đề này trong quá trình xuất .swf, nó loại bỏ sự im lặng bằng tay. Những người sử dụng âm thanh phát trực tuyến (hoặc mxmlc thuần túy) đạt được vòng lặp thông qua SampleDataEvent và thả mẫu thủ công hoặc tiền xử lý tệp MP3 (xem blog của Andre Michelle và tiện ích mp3loop CompuPhase )
Ngoài ra, sử dụng bộ giải mã MP3 về mặt kỹ thuật đòi hỏi bạn phải có giấy phép bằng sáng chế để sử dụng (vì bằng sáng chế MP3 thuộc sở hữu của Techncolor, Fraunhofer và những người khác). Rõ ràng hàng tấn người đã phát hành các trò chơi phần mềm miễn phí sử dụng MP3, nhưng tốt nhất là không nên loay hoay với điều đó.
Định dạng tốt nhất cho trò chơi video là gì và những thuộc tính nào là đủ (Hertz, bitrate, v.v.), giả sử rằng MP3 320kbps là "nặng"?
Có thể một hoặc hai ví dụ, làm thế nào một số tiêu đề AAA hoạt động với âm thanh của chúng.
Điều đó phụ thuộc: Nền tảng mục tiêu của bạn là gì, bạn đang sử dụng công nghệ nào khác, cách bạn phân phối trò chơi của mình và bạn đang theo phong cách nào? Tôi sẽ chia nó thành một vài loại dựa trên nền tảng, công nghệ và thẩm mỹ.
Các tiêu đề PC và Console cao cấp
Các trò chơi AAA sẽ có chất lượng sản xuất hàng đầu, vì vậy chúng ghi và sản xuất tài sản không nén 24bit / 48kHz (cũng là tiêu chuẩn cho hậu kỳ phim). Các tiêu đề với tham vọng ít hơn một chút so với Battlefield 3 có thể ghi và sản xuất trong 16 / 44.1, đây là tiêu chuẩn chính thức cho âm thanh chất lượng CD.
Tất nhiên, bạn không thể gửi một loạt 24/48 WAV không nén với một trò chơi, nó sẽ quá lớn. Vì vậy, cuối cùng phải có một số loại nén xảy ra. Nói chung, nguyên tắc chung là, nếu đó là hiệu ứng âm thanh nhanh như tiếng súng (như tiếng súng của Portal 2 trong câu trả lời của Sprunth), bạn có thể để nó ở dạng WAV, có thể giảm tốc độ mẫu tùy theo tần số (xem phần Định lý Nyquist , âm thanh được tạo thành từ nội dung tần số thấp có thể được mã hóa ở tốc độ lấy mẫu thấp hơn). Đối với âm nhạc, thực sự không có cách nào để nén. Ogg Vorbis với chất lượng CD là con đường để đi (44,1kHz, chất lượng 5-6 hoặc cao hơn).
Ngoài ra, các trò chơi AAA thường sẽ sử dụng một công cụ trung gian để nén, hoặc là một công cụ nội bộ hoặc phần mềm trung gian âm thanh như FMOD hoặc Wwise. Cách thức hoạt động trong FMOD và Wwise là bạn nhập hầu hết mọi thứ dưới dạng 16 / 44.1 hoặc 24/48 WAV (hoặc, nếu âm thanh là tất cả nội dung tần số thấp, nó có thể được nhập với tốc độ lấy mẫu thấp hơn), sau đó cung cấp cho FMOD hệ số nén cho từng nội dung, chọn mã hóa như ADPCM, MP3 hoặc Ogg Vorbis.
FMOD thực sự gần đây đã bỏ hỗ trợ mã hóa tài sản trong các soundbanks bạn xuất từ FMOD Designer (tệp .fsb) vì Ogg Vorbis ủng hộ một codec mới từ Xiph có tên là CELT . Ogg Vorbis có thể hơi khó khăn với CPU, vì vậy CELT đang được phát triển để cung cấp một giải pháp thay thế. Bạn có thể tải các tệp trực tiếp, nhưng không còn sử dụng để mã hóa từ ứng dụng Designer.
Nhân tiện, đây là một liên kết thú vị về âm thanh của Battlefield Bad Company cũng được đưa vào một chút. DICE khá nhiều đi đầu trong công nghệ âm thanh trong các trò chơi, vì vậy đây là một loạt tốt để nghiên cứu.
Ngoài ra, liên quan đến âm thanh vòm là vấn đề mono vs stereo. Chỉ trong trường hợp bạn không biết, tất cả các hiệu ứng âm thanh của bạn phải là đơn âm, trừ khi một số trong số chúng thực sự sử dụng hiệu ứng lia máy. Âm thanh nổi lúng túng trong không gian 3d và bạn có thể xoay âm thanh trong mã để đặt chúng vào môi trường 2d.
Các tiêu đề hơi ít, cao cấp, các trò chơi Indie
Rõ ràng điều này có thể rất khác nhau. Nhìn lướt qua cho thấy Frozen Synapse sử dụng hoàn toàn các tệp Ogg Vorbis, cho cả hiệu ứng âm thanh và âm nhạc. Mặt khác, Dungeons of Dredmor tuân theo sơ đồ của Ogg Vorbis cho âm nhạc và WAV 16 / 44.1 cho hiệu ứng âm thanh.
Cách tiếp cận Dungeons của Dredmor là thích hợp hơn. Ngay cả được lưu trữ dưới dạng WAV không nén, hiệu ứng âm thanh nói chung đủ ngắn để chúng không chiếm nhiều dung lượng và bạn tiết kiệm được rất nhiều chu kỳ CPU mà không phải giải mã chúng. Bạn muốn có thể nhanh chóng tải một hiệu ứng âm thanh vào bộ nhớ và phát nó. Nếu bạn mã hóa hiệu ứng âm thanh của mình trong Ogg Vorbis, sẽ có khả năng bị trễ rất ít trước khi người chơi nghe thấy hiệu ứng âm thanh của bạn lần đầu tiên.
Trò chơi trình duyệt, HTML5 và Flash (với một chút di động)
Âm thanh HTML5 là một mớ hỗn độn. Bạn phải cung cấp cả phiên bản ogg và MP3 cho âm thanh của mình. Mã hóa với chất lượng cao nhất bạn có thể mà không cần người dùng hoành hành trong thời gian tải dài. Đối với MP3, đừng xuống dưới 128k, nó đủ tệ ở mức 128.
Flash chỉ chấp nhận MP3 16bit / 44.1kHz trừ khi bạn thực hiện và viết bộ giải mã của riêng bạn cho một số định dạng khác (như bộ giải mã Ogg Vorbis thử nghiệm trong phòng thí nghiệm Alchemy). Trước đây, Flash có vấn đề với MP3 Tốc độ bit biến đổi, nhưng tôi chưa bao giờ gặp sự cố. Cài đặt chất lượng bạn chọn cho trò chơi Flash sẽ phụ thuộc vào mức độ bạn muốn .swf cuối cùng của bạn lớn đến mức nào.
Cập nhật: Như Tetrad đã đề cập , các trò chơi di động phải được xem xét với bộ nhớ và lưu trữ. Cách bạn mã hóa âm thanh cho các trò chơi di động giống như Flash, bạn muốn giữ lại chất lượng cao nhất có thể, nhưng cuối cùng bạn phải phù hợp với ngân sách bộ nhớ và lưu trữ. Trình theo dõi nhạc đặc biệt tốt nếu bạn có ngân sách lưu trữ chặt chẽ cho âm nhạc. Nói với nhà soạn nhạc của bạn để hạn chế bảng mẫu của mình và bạn có thể phù hợp với một tấn âm nhạc hơn trong trò chơi.
Hiệu ứng âm thanh và âm nhạc "8-bit" hoặc Chiptune
Hầu hết các trò chơi sẽ làm những gì Frozen Synapse và Dungeons of Dredmor làm. Tuy nhiên, có lẽ bạn có thể thoát khỏi việc giảm tốc độ lấy mẫu và độ sâu bit. Nó không chỉ có thể phù hợp với thẩm mỹ mà bạn đang đi, mà còn có thể giúp bạn tiết kiệm không gian.
Ngoài ra, nhạc theo dõi thường lưu trữ các mẫu ở tốc độ mẫu thấp, cứ để nó xảy ra.