lệnh haimss không hoàn toàn đúng. Theo kinh điển, bạn xoay bằng cách giảm âm lượng của một kênh. Điều đó có nghĩa là: nếu bạn muốn tín hiệu của mình ở bên trái 80%, kênh bên trái sẽ giữ âm lượng gốc trong khi kênh bên phải chỉ nhận được 20% âm lượng ban đầu. Ít nhất đó là những gì mà mã panning của sox đã làm (và những gì Alan Blumlein dường như đã được cung cấp khi phát minh ra âm thanh nổi).
Ngoài ra lệnh của anh ta có thể được rút ngắn bằng cách sử dụng tùy chọn phối lại.
Do đó, lệnh được sửa và rút ngắn là:
sox left.wav right.wav stereo.ogg remix 1,2v0.2 1v0.2,2
chỉnh sửa để trả lời bình luận của haimss:
sox sẽ cảnh báo bạn nếu cắt xén. Nhưng vâng, nó có thể. Với tùy chọn phối lại, mọi âm lượng kênh được chia tỷ lệ với hệ số 1 / n, trong đó n là số lượng kênh đầu vào. Nhưng điều đó chỉ được sử dụng nếu KHÔNG CÓ LỰA CHỌN VULME được chỉ định cho kênh đầu ra (vì vậy 100% + 20% của bạn là chính xác).
sox cũng có một tùy chọn để chia tỷ lệ bất kỳ kênh nào mà không có thông tin âm lượng rõ ràng, chỉ cần thêm "-a" sau "phối lại" (như "phối lại -a 1,2v0.2 1v0.2,2") và âm lượng sẽ như 50 % + 20% = 70%. Điều này khá khó hiểu và đến bây giờ tôi không chắc chắn liệu bạn cũng phải chia tỷ lệ âm lượng kênh bị rỗ lên 1 / n, điều này sẽ dẫn đến "phối lại -a 1,2v0.1 1v0.1,2", hoặc 50% + 10% = 60%. Tôi sẽ phải điều tra thêm theo hướng này. Trong khi đó, bạn có thể đọc phần phối lại trong trang man của sox (cũng có sẵn tại trang chủ sox ).
chỉnh sửa sau khi phản ánh thêm:
Sau khi suy nghĩ về nó, tôi khá là chắc chắn rằng bạn cũng phải chia tỷ lệ khối lượng theo tỷ lệ 1 / n.
Về vấn đề cắt: Bằng cách chia TẤT CẢ khối lượng cho số lượng kênh, vấn đề này không thể xảy ra. Nhưng điều đó không bảo toàn công suất ban đầu của tín hiệu, bởi vì công suất của tín hiệu là logarit, không phải tuyến tính. Bạn càng trộn nhiều kênh, tín hiệu sẽ càng im lặng. Đó là lý do tại sao sox cũng có các tùy chọn cho điều đó, trong đó các tập được chia tỷ lệ 1 / sqrt (n). Để sử dụng điều này, chỉ cần lấy "p" thay vì "v" ở phần phối lại và điều chỉnh các giá trị cho phù hợp, đồng thời thêm "-p" -option sau câu lệnh phối trộn lại. Bạn có thể thấy sự khác biệt của tỷ lệ theo tỷ lệ 1 / n và 1 / sqrt (n) tại đây .
Sau đây là cách tôi nghĩ để tính toán các giá trị công suất chính xác: cho mỗi kênh bạn phải giải 20 * log_10 (hệ số). Hệ số 2 sẽ dẫn đến ~ 6 (dB), hệ số 0,5 sẽ dẫn đến ~ -6 (dB). Đó chính xác là những gì hướng dẫn sử dụng sox nói, vì vậy tôi đoán điều này là đúng.
Vì vậy, cuối cùng lệnh trong trường hợp của bạn phải là:
sox left.wav right.wav stereo.ogg remix -p -a 1,2p-6 1p-6,2
Tôi không có sox trên máy này, vì vậy tôi không thể kiểm tra lệnh này cho đúng cú pháp, vì vậy vui lòng cho tôi biết nếu có vấn đề. Tôi sẽ kiểm tra tất cả lý thuyết này ngay khi tôi có cơ hội, bởi vì tôi sẽ phải đối mặt với một vấn đề tương tự, nhưng tôi sẽ phải trộn nhiều kênh hơn chỉ 2, và đó là lý do tại sao tôi nghĩ ra thứ công suất tín hiệu đó.