Tôi cố gắng để hiểu làm thế nào iPhone của tôi có thể tiếp tục lắng nghe tôi nói Hey Siri
, Alexa
, Hey Cortana
hoặc Okay Google
không một cách nhanh chóng tháo pin của tôi xuống.
Tôi tưởng tượng hai loại thuật toán. Một lát ghi lại thời gian như lát cắt rộng 10 ms mỗi lát 200 ms và thực hiện phát hiện đồng bộ trên các tần số cụ thể. Tuy nhiên những thông số này phụ thuộc mạnh mẽ vào đặc tính của giọng nói của tôi. Hơn nữa, nó vẫn sẽ tiêu tốn rất nhiều năng lượng CPU để liên tục cố gắng kết hợp một Hey Siri
ở giữa hư không.
Những loại thuật toán / thực hiện năng lượng thấp hiệu quả (phần cứng hoặc phần mềm) có thể thực hiện nhiệm vụ đó?
Điều này bằng cách nào đó liên quan đến bằng sáng chế này, tôi nghĩ: https://www.google.com/patents/US20160253997
Tôi đọc một số bài báo nói về các mô hình Markov ẩn, nhưng tôi nghi ngờ đó là cách tiếp cận quyền lực rất thấp.