Chỉ cho người khác cách tôi nghe chính mình


18

Sooo .. Tôi đã suy nghĩ về những thứ này. Chúng ta đều biết rằng chúng ta nghe khác với những gì chúng ta nghe thấy về giọng nói của chính mình. Thật dễ dàng để tìm ra cách người khác nghe chúng ta bằng cách ghi lại chính mình và lắng nghe nó.

Nhưng những gì về cách khác xung quanh?

Có cách nào để biến đổi giọng nói của chúng ta theo cách mà người khác có thể nghe thấy chúng ta khi chúng ta cảm nhận giọng nói của chính mình? Tôi thấy đó là một câu hỏi khá thú vị. Đáng buồn là tôi không thể tìm thấy bất cứ điều gì trên web sau một vài tìm kiếm google. Không ai nghĩ về điều này hoặc là không thể vì một số lý do mà tôi không nhìn thấy?

Bất kỳ khách hàng tiềm năng về điều này sẽ được đánh giá cao :).


5
Bạn có thể làm cho vấn đề trở nên dễ dàng nhất có thể: Ghi lại bài phát biểu của bạn, khi bạn nghe qua tai nghe, âm thanh giống như lời nói của bạn phát ra khi bạn nói trong buồng không phản xạ. Không chắc chắn làm thế nào để làm điều đó.
Olli Niemitalo

2
Tôi chỉ muốn đề xuất chính xác điều đó. Tuy nhiên, có thực sự cần thiết để loại trừ ảnh hưởng của căn phòng? Sự chỉ đạo của giọng nói của bạn như một nguồn âm thanh chắc chắn là một yếu tố, nhưng tôi nghĩ phương pháp này có thể sẽ hoạt động khá tốt nếu việc ghi âm được thực hiện ở cùng một nơi với "quy trình điều chỉnh" diễn ra.
applesoup

Câu trả lời:


10

Điều đó không phải là không thể nhưng nó cũng sẽ không phải là một cuộc dạo chơi trong công viên.

Những gì bạn sẽ cố gắng làm là thêm vào tín hiệu giọng nói, những rung động đó được truyền đến tai qua xương và không ai có thể truy cập được.

Nhưng điều này nói thì dễ hơn làm một cách chính xác.

Sự truyền âm thanh qua một môi trường phụ thuộc rất nhiều vào mật độ của nó . Âm thanh di chuyển với tốc độ ~ 1500m / giây trong nước và ít bị phân tán hơn so với truyền trong không khí (~ 340m / giây). Xương dày đặc hơn không khí, do đó âm thanh sẽ truyền nhanh hơn qua xương. Điều này có nghĩa là âm thanh "của bạn" bắt đầu kích thích đôi tai của bạn trước tiên, tiếp theo là âm thanh mà bạn cảm nhận được thông qua kênh không khí "bình thường". Trong thực tế, xương có cấu trúc bên trong có thể ảnh hưởng đến cách các tần số khác nhau đi qua nó nhưng ở dải tần số mà chúng ta đang nói đến, có lẽ chúng ta có thể coi nó như một chất rắn tương đương. Điều này chỉ có thể gần đúng bởi vì bất kỳ nỗ lực đo lường nào cũng phải xâm lấn nhưng cũng vì thính giác là chủ quan.

Thính giác, hoặc nhận thức của âm thanh là một HUGE đóng góp khó khăn ở đây. Bản thân tai, tai ngoài (bit có thể nhìn thấy), ống tủy và cơ chế bên trong hoạt động cùng nhau theo những cách rất phức tạp. Đây là chủ đề của âm thanh học tâm lý . Một ví dụ về quá trình xử lý phức tạp này là các âm ảo trong đó bộ não đang lấp đầy những thứ được cho là ở đó. Bộ não có thể đã phát triển các cách cô lập tín hiệu tự tạo mà chúng ta không thể truy cập được.

Nhưng, một cách đơn giản ( đơn giản! ) Để chứng kiến ​​sự khác biệt giữa việc là người nghe âm thanh của chính bạn và không phải là đây:

Ghi lại một từ ngắn và đơn giản (ví dụ "Xương cá", một từ có cả tần số thấp (b, o, n) và tần số cao (F, sh, i, e)) với một chút im lặng và lặp lại thông qua bộ cân bằng thông qua tai nghe của bạn. Bắt đầu phát lại và đồng bộ hóa việc bạn tự thốt ra từ đó với bản ghi âm (vì vậy, một cái gì đó như "Xương cá ... Xương cá ... Xương cá ..."). Bây giờ hãy thử nghịch với bộ cân bằng cho đến khi những gì bạn nghe và những gì bạn nói hoàn toàn tương tự nhau.

Vào thời điểm đó, các cài đặt trên bộ chỉnh âm sẽ thể hiện sự khác biệt giữa âm thanh và âm thanh được cảm nhận qua bạn và về mặt lý thuyết, bất kỳ lời nói nào khác được truyền qua bộ chỉnh âm đó sẽ mô phỏng cách nó đến tai bạn, như thể bạn đã tạo ra nó bằng một nguồn bên trong cơ thể bạn.

Hi vọng điêu nay co ich.


1
có lẽ không thể do sự khác biệt cá nhân về nhận thức và không thể định lượng được tính chủ quan đó. Tuy nhiên, sự khác biệt có thể là nhỏ, chẳng hạn như trong trường hợp mỗi nắp 1000uF được sản xuất thực sự hơi khác nhau ...
Fat32

1
@ Fat32 Tôi không thể quyết định về tính không thể bởi vì về mặt kỹ thuật, có thể định lượng / đo lường sự đóng góp của kênh thứ hai được thiết lập thông qua xương và thông qua các giả định hợp lý đưa ra một số xấp xỉ. Giống như những gì nó cảm thấy giống như trong một điều kiện y tế hoàn toàn khác nhau đối với quan điểm "bệnh nhân". Đó sẽ là một xấp xỉ tốt hơn so với chỉ EQ. Nhưng tại thời điểm nhận thức, vâng, ngay bây giờ không thể đề xuất "bộ lọc" dứt khoát sẽ biến đổi clip âm thanh theo yêu cầu.
A_A

tái khẳng định theo một cách khác: được đưa ra cùng một kích thích tâm lý chính xác được tạo ra tại ốc tai của hai cá thể riêng biệt, họ sẽ (có thể) nghe hai nhận thức khác nhau và những gì họ thực sự nghe thấy (afaik) là một trải nghiệm bản thân bị đóng vào bất kỳ điều tra bên ngoài nào thuộc bất kỳ loại toán học nào ... Điều đó có nghĩa là, con người có thể giao tiếp bằng âm thanh là kết quả của bản chất rời rạc của ngôn ngữ.
Fat32

Cảm ơn rất nhiều! Điều này đã rất nhiều thông tin và hữu ích và đồng thời rất thất vọng xD. Tôi sợ rằng mọi cấu trúc xương của con người làm thay đổi âm thanh theo một cách khác .. nhưng tôi không nghĩ về tai như một sự xáo trộn khác. Chà, ít nhất MIGHT của họ tồn tại một chức năng nhất định cho mỗi cá nhân con người dịch âm thanh ~ theo đó.
Dunkingdev

@KevinFiegenbaum Cảm ơn bạn đã cho tôi biết. Nhận thức là nguồn gốc của rất nhiều suy nghĩ. Bộ não kết hợp với thực tế thông qua các giác quan và tạo ra và xác nhận (hoặc từ chối) các mô hình về những gì có thể xảy ra. Ảo ảnh quang học là trường hợp hai "dự đoán" (mô hình) phù hợp với cùng một lời giải thích và bộ não không thể quyết định nên nó chuyển đổi giữa chúng. Tất cả các giác quan đến não đã được mã hóa và thật khó để biết được chúng được trải nghiệm như thế nào bởi cá nhân. Điều tốt nhất chúng ta có thể làm là một phỏng đoán hợp lý. Tất cả tốt nhất.
A_A

11

Nỗ lực thiết thực nhất mà tôi biết là của Won và Berger (2005) . Họ đồng thời ghi âm giọng hát ở miệng bằng micro và trên hộp sọ bằng máy đo rung tự chế. Sau đó, họ ước tính các hàm truyền có liên quan với mã hóa dự đoán tuyến tính và làm mịn cepstral.


0

Trước khi bạn thất vọng, hãy để tôi đề nghị bạn thử một cách tiếp cận khác.

Như tôi thấy, bạn có hai phần rất khác nhau: biết cách cân bằng để làm (được cá nhân hóa cho mỗi người) và áp dụng nó cho một tín hiệu cụ thể (giọng nói của bạn).

Phần 1: mô hình hệ thống thính giác nội bộ của con người

Có những chuyên gia đang làm việc để thu thập dữ liệu về điều đó, chuẩn hóa quy trình đó, v.v. Afaik, có những nỗ lực để phát triển các biện pháp và đồ thị vượt ra ngoài thính lực cổ điển (đo tín hiệu không khí và xương). Một số trong số đó là "bài kiểm tra nghe" (chủ quan hơn, nhưng cũng thú vị).

Phù hợp với các chuyên gia. Nếu bạn theo dõi công việc của họ, bạn chỉ cần kết quả của họ. Hãy để họ làm việc nặng. Họ biết phần của họ, điều này khiến họ mất hàng chục năm điều tra. Họ đang tiến bộ trong kiến ​​thức bạn cần. Đó là: một loại thính lực để đo lường cách ai đó nghe thấy 'bên trong'. Tôi cá là họ đang vẽ đồ thị đó. Và bạn chỉ cần đồ thị đó.

Phần 2: mô phỏng

Tôi đã làm một cái gì đó tương tự như những gì bạn cố gắng làm. Từ thính lực của bất kỳ người nào, bạn có thể tự mình nghe giống như anh ấy / cô ấy. Điều này được thực hiện với ffmpeg. Bạn có thể kiểm tra nó ở đây: comomeoyes.com

Về cơ bản, bạn ghi lại giọng nói của mình và thuật toán sẽ cân bằng giọng nói với thính lực cá nhân của bạn. Bằng cách này, bạn có thể nhập thính lực của một người bị mất thính lực và tự lắng nghe cách anh ấy / cô ấy nghe thấy bạn.

Tôi hiểu bạn cũng muốn làm như vậy, nhưng với một thính lực khác, một mô hình làm thế nào hệ thống thính giác bên trong cân bằng âm thanh.

Tôi cá là loại thính lực như vậy đã có thể tồn tại, và các nhà thính học, y học, bác sĩ chuyên khoa tai mũi họng, các nhà nghiên cứu và có thể thảo luận về các loại xét nghiệm âm thanh để làm dữ liệu họ cần để mô hình hóa một biểu đồ hữu ích từ các phép đo.

Chúc may mắn. Nỗ lực của bạn có thể giúp đỡ người khác.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.