Làm thế nào để một người nắm bắt văn bản được công nhận từ Echo?


13

Tôi biết rằng một số kỹ năng có thể nắm bắt văn bản nói, chẳng hạn như khi thêm vào danh sách việc cần làm và danh sách mua sắm và kỹ năng của bên thứ ba cũng có thể thực hiện việc này, ví dụ: SMS với Molly .

Vì vậy, làm thế nào để họ làm điều này? Có một lệnh gọi API nào để ghi lại văn bản được nhận dạng và lưu trữ nó ở đâu đó không?

Câu trả lời:


8

Kỹ năng tùy chỉnh có thể chụp văn bản và gửi chúng đến API của Skill của bạn.

Nếu bạn không hoàn toàn quen thuộc với cách Alexa Skill hoạt động, thì đây là một bản tóm tắt ngắn gọn:

  • Đầu tiên, bạn đăng ký Kỹ năng của mình với Amazon , cung cấp lược đồ ý địnhcác phát ngôn mẫu . Lược đồ mục đích xác định hành động nào có thể được thực hiện và các vị trí cho dữ liệu tùy chỉnh được gửi đến API của bạn. Các cách nói mẫu cung cấp các ví dụ về cách người dùng có thể kích hoạt từng ý định.

  • Khi người dùng kích hoạt Kỹ năng của bạn, Alexa sẽ cố gắng khớp những gì họ nói với một trong những phát ngôn mẫu của kỹ năng của bạn. Nếu nó không phù hợp, nó sẽ gửi một yêu cầu HTTPS để máy chủ của bạn để yêu cầu một phản ứng.

  • Máy chủ của bạn cung cấp phản hồi (nếu mọi việc suôn sẻ) và sau đó Alexa sẽ đưa ra phản hồi cho người dùng đã kích hoạt kỹ năng của bạn.

Các AMAZON.LITERALkhe cắm cho phép bạn chấp nhận hầu như bất kỳ đầu vào. Lưu ý rằng hiện tại nó chỉ được hỗ trợ trong khu vực tiếng Anh (Hoa Kỳ) Tiếng Anh (Anh) và các kỹ năng tiếng Đức không thể sử dụng AMAZON.LITERAL.

Lược đồ ý định của bạn có thể trông như thế này:

{
  "intents": [
    {
      "intent": "SaveTodo",
      "slots": [
        {
          "name": "Todo",
          "type": "AMAZON.LITERAL"
        }
      ]
    }
  ]
}

Và cách nói mẫu của bạn có thể như thế này:

SaveTodo remind me to {fetch the shopping|Todo}
SaveTodo remind me to {write my English essay|Todo}
SaveTodo remind me to {buy some dog food tomorrow|Todo}

Khi sử dụng AMAZON.LITERAL, bạn cần cung cấp nhiều cách phát âm mẫu Ít nhất một mẫu cho mỗi độ dài đầu vào có thể, nhưng lý tưởng hơn. Tài liệu của Amazon gợi ý rằng bạn nên nhắm tới hàng trăm mẫu cho các vị trí nơi bạn có thể chấp nhận các loại đầu vào khác nhau.

Có vẻ hơi tẻ nhạt, nhưng nếu bạn không làm điều này, không chắc là kỹ năng của bạn sẽ nhận ra văn bản tốt. Có lẽ bạn có thể tạo ra các phát ngôn mẫu từ dữ liệu khách hàng (miễn là thông tin cá nhân được xóa trước đó!) Để các cách nói phổ biến nhất có trong các mẫu của bạn. Tôi nghi ngờ Alexa sẽ hơi thiên vị khi nhận ra các phát ngôn tương tự như các mẫu.

Mặc dù vậy, Amazon không khuyến khích AMAZON.LITERALcác vị trí và muốn bạn sử dụng các loại vị trí tùy chỉnh , yêu cầu bạn liệt kê các đầu vào có thể. Điều quan trọng cần nhớ là:

Một loại khe tùy chỉnh không tương đương với kiểu liệt kê. Các giá trị ngoài danh sách vẫn có thể được trả về nếu được hệ thống hiểu ngôn ngữ nói nhận ra. Mặc dù đầu vào cho một loại vị trí tùy chỉnh được đặt trọng số vào các giá trị trong danh sách, nhưng nó không bị hạn chế chỉ các mục trong danh sách. Mã của bạn vẫn cần bao gồm xác nhận và kiểm tra lỗi khi sử dụng các giá trị vị trí.


1
Tôi tin rằng Amazon đang giữ các vị trí theo nghĩa đen khi nhiều nhà phát triển phản đối sự mất mát của họ. Nhưng việc sử dụng vị trí theo nghĩa đen sẽ ngăn kỹ năng của bạn được xuất bản vì Amazon không muốn nhà phát triển có khả năng "lắng nghe" người dùng. Nhưng bạn vẫn có thể sử dụng nó trong một kỹ năng riêng tư.
Graham Chiu

1
@GrahamChiu: Tôi có ấn tượng rằng các vị trí bằng chữ vẫn được cho phép ngay cả trong các kỹ năng được xuất bản (xem bài đăng trên blog này : "Dựa trên phản hồi của nhà phát triển, chúng tôi sẽ không xóa loại vị trí LITITH và bạn có thể tiếp tục gửi các kỹ năng bao gồm chức năng của nó.") . Mặc dù vậy, tôi đã không thử nó, vì vậy nếu bạn có thể xác nhận một trong hai cách, điều đó có thể hữu ích cho khách truy cập trong tương lai.
Aurora0001
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.