Làm cách nào tôi có thể thay đổi cách phát âm của Alexa một từ cụ thể trong một kỹ năng?

Đôi khi, khi phát triển kỹ năng Alexa và lập trình các phản hồi từ dịch vụ của tôi, Alexa phát âm sai một trong những từ trong câu trả lời của tôi, khiến người dùng bối rối.

Ví dụ, nếu tôi muốn Alexa nói một từ bằng một ngôn ngữ khác (có lẽ là về kỹ năng học ngôn ngữ), làm thế nào tôi có thể nói với Alexa cách phát âm từ đó một cách chính xác, thay vì áp dụng các quy tắc phát âm tiếng Anh?

Điều này cũng áp dụng cho các từ tiếng Anh có cách phát âm lẻ; Có cách nào để ra lệnh cho Alexa phát âm đúng, hoặc thay thế nó bằng một âm thanh tùy chỉnh là chính xác? Tôi có cần sử dụng đánh dấu bổ sung hoặc lệnh gọi API không?

alexa

— Aurora0001
nguồn

Alexa hỗ trợ SSML , đây là ngôn ngữ đánh dấu giống như XML cho lời nói. Thay vì trả lại văn bản đơn giản từ dịch vụ của bạn, bạn có thể sử dụng các phản hồi SSML. Các <phoneme>từ khóa là những gì bạn cần đặc biệt:

đơn âm

Cung cấp một cách phát âm ngữ âm / ngữ âm cho văn bản chứa. Ví dụ, mọi người có thể phát âm các từ như kiểu pecan khác nhau.

Đối với các từ tiếng Anh (đặc biệt là tiếng Anh Mỹ), Alexa sẽ có thể phát âm bất kỳ từ nào nếu bạn phát âm đúng ngữ âm:

Các bảng sau liệt kê các ký hiệu được hỗ trợ để sử dụng với thẻ âm vị. Những biểu tượng này cung cấp bảo hiểm đầy đủ cho âm thanh của tiếng Anh Mỹ. Lưu ý rằng nhiều ngôn ngữ không phải tiếng Anh yêu cầu sử dụng các ký hiệu không có trong danh sách này, không được hỗ trợ. Việc sử dụng các ký hiệu không có trong danh sách này không được khuyến khích, vì nó có thể dẫn đến tổng hợp giọng nói dưới mức tối ưu.

^{Trích dẫn từ tài liệu của Amazon về SSML.}

Đây là một ví dụ về cách cho Alexa phát âm cụ thể:

<speak>
    <phoneme alphabet="ipa" ph="hɛˈləʊ̯">Hello</phoneme>.
    <phoneme alphabet="ipa" ph="bɔ̃.ˈʒuʁ">Bonjour</phoneme>.
</speak>

Các <phoneme>thẻ hỗ trợ IPA và X-SAMPA bảng chữ cái ngữ âm. Thông thường, bạn có thể tìm cách viết IPA cho bất kỳ từ nào trên Wiktionary hoặc thông qua Google.

Đối với các tin nhắn dài hơn, tốt nhất nên sử dụng <audio>thẻ và ghi âm giọng nói tùy chỉnh:

Thẻ âm thanh cho phép bạn cung cấp URL cho tệp MP3 mà dịch vụ Alexa có thể phát trong khi hiển thị phản hồi. Bạn có thể sử dụng điều này để nhúng âm thanh ngắn, được ghi trước trong phản hồi của dịch vụ. Ví dụ: bạn có thể bao gồm các hiệu ứng âm thanh bên cạnh các phản hồi chuyển văn bản thành giọng nói hoặc cung cấp phản hồi bằng giọng nói liên quan đến thương hiệu của bạn.

^{Trích dẫn từ tài liệu Amazon trên <audio>.}

— Aurora0001
nguồn