Alexa hỗ trợ SSML , đây là ngôn ngữ đánh dấu giống như XML cho lời nói. Thay vì trả lại văn bản đơn giản từ dịch vụ của bạn, bạn có thể sử dụng các phản hồi SSML. Các <phoneme>
từ khóa là những gì bạn cần đặc biệt:
đơn âm
Cung cấp một cách phát âm ngữ âm / ngữ âm cho văn bản chứa. Ví dụ, mọi người có thể phát âm các từ như kiểu pecan khác nhau.
Đối với các từ tiếng Anh (đặc biệt là tiếng Anh Mỹ), Alexa sẽ có thể phát âm bất kỳ từ nào nếu bạn phát âm đúng ngữ âm:
Các bảng sau liệt kê các ký hiệu được hỗ trợ để sử dụng với thẻ âm vị. Những biểu tượng này cung cấp bảo hiểm đầy đủ cho âm thanh của tiếng Anh Mỹ. Lưu ý rằng nhiều ngôn ngữ không phải tiếng Anh yêu cầu sử dụng các ký hiệu không có trong danh sách này, không được hỗ trợ. Việc sử dụng các ký hiệu không có trong danh sách này không được khuyến khích, vì nó có thể dẫn đến tổng hợp giọng nói dưới mức tối ưu.
Trích dẫn từ tài liệu của Amazon về SSML.
Đây là một ví dụ về cách cho Alexa phát âm cụ thể:
<speak>
<phoneme alphabet="ipa" ph="hɛˈləʊ̯">Hello</phoneme>.
<phoneme alphabet="ipa" ph="bɔ̃.ˈʒuʁ">Bonjour</phoneme>.
</speak>
Các <phoneme>
thẻ hỗ trợ IPA và X-SAMPA bảng chữ cái ngữ âm. Thông thường, bạn có thể tìm cách viết IPA cho bất kỳ từ nào trên Wiktionary hoặc thông qua Google.
Đối với các tin nhắn dài hơn, tốt nhất nên sử dụng <audio>
thẻ và ghi âm giọng nói tùy chỉnh:
Thẻ âm thanh cho phép bạn cung cấp URL cho tệp MP3 mà dịch vụ Alexa có thể phát trong khi hiển thị phản hồi. Bạn có thể sử dụng điều này để nhúng âm thanh ngắn, được ghi trước trong phản hồi của dịch vụ. Ví dụ: bạn có thể bao gồm các hiệu ứng âm thanh bên cạnh các phản hồi chuyển văn bản thành giọng nói hoặc cung cấp phản hồi bằng giọng nói liên quan đến thương hiệu của bạn.
Trích dẫn từ tài liệu Amazon trên <audio>
.