Có phải Amazon Echo 'luôn lắng nghe' và gửi dữ liệu lên đám mây?


20

Một số nguồn tin tức như IntellihubCEPro dường như gợi ý rằng trợ lý nhà Echo của Amazon liên tục lắng nghe các cuộc trò chuyện và gửi chúng qua Internet đến các máy chủ của Amazon. CEPro tuyên bố rằng:

Bằng cách nói một cụm từ quan trọng, Amazon gọi một từ đánh thức tiếng Anh, tiếng Echo trở nên sống động và bắt đầu lắng nghe các lệnh. Theo mặc định, từ đánh thức là Alexa.

Nếu bạn đọc lại câu cuối cùng thì nó có thể không có ý nghĩa, đặc biệt nếu bạn đang ở trong lĩnh vực bảo mật. Theo Amazon, Echo chỉ lắng nghe các lệnh một khi nó nghe thấy từ thức tỉnh của nó. Làm sao nó biết khi bạn đã nói từ đánh thức nếu nó chưa nghe?

Bài viết của Intellihub cũng tương tự như vậy trong tình cảm của nó:

Thiết bị của Amazon Amazon Echo, một loa Bluetooth liên tục nghe kết nối với các dịch vụ phát nhạc như Pandora và Spotify bằng âm thanh của giọng nói của một người, có thể dễ dàng bị hack và sử dụng bởi các cơ quan chính phủ như FBI để nghe trong các cuộc hội thoại.

(Lưu ý rằng tôi không đặc biệt tập trung vào việc khám phá khía cạnh hack của câu hỏi này, vì điều đó có lẽ sẽ quá nhiều cho một câu hỏi. Trọng tâm chính của tôi là khía cạnh luôn luôn bật và liệu điều này có gửi dữ liệu mọi lúc không .)

Không bài viết nào có vẻ đặc biệt muốn tiết lộ một nguồn cho các khiếu nại của nó, điều này gợi ý cho tôi rằng chúng không được chứng minh là tốt nhất, hoặc clickbait là tồi tệ nhất.

Là Echo luôn ghi và gửi dữ liệu lên đám mây, hoặc những tuyên bố trên không có căn cứ? Amazon Echo xử lý dữ liệu như thế nào nếu không phải lúc nào cũng gửi dữ liệu đến các máy chủ trong đám mây?

Câu trả lời:


14

Vâng, nó luôn luôn lắng nghe. Không, không phải lúc nào nó cũng gửi lên đám mây.

Rõ ràng thiết bị phải luôn luôn lắng nghe để phát hiện từ đánh thức. Tuy nhiên, điều đó được thực hiện bởi một công nghệ gọi là.

  1. Làm thế nào để Amazon Echo và Echo Dot nhận ra từ đánh thức?

Amazon Echo và Echo Dot sử dụng tính năng phát hiện từ khóa trên thiết bị để phát hiện từ đánh thức. Khi các thiết bị này phát hiện từ đánh thức, chúng truyền âm thanh đến Đám mây , bao gồm một phần giây của âm thanh trước từ đánh thức.

( Câu hỏi thường gặp )

Do đó, theo Amazon, phát hiện từ đánh thức là trên thiết bị. Điều này có thể được kiểm tra rất dễ dàng bằng cách cấm thiết bị truy cập Internet trong bộ định tuyến của bạn. Echo / Echo Dot vẫn sẽ nhận ra từ đánh thức, nhưng vòng sáng sẽ chuyển sang màu đỏ và thiết bị cho bạn biết nó không có kết nối Internet. Vì vậy, chúng tôi có thể xác minh rất đơn giản rằng việc nhận dạng từ thức tỉnh thực sự được thực hiện tại địa phương .

Chỉ sau khi phát hiện từ đánh thức, thiết bị sẽ liên lạc với dịch vụ đám mây Alexa.

Theo Amazon, thiết bị chỉ phát trực tiếp lên đám mây khi vòng sáng có màu xanh và nó hoàn toàn không nghe khi bạn tắt tiếng và vòng sáng phát ra màu đỏ đặc. Tất nhiên, những người thận trọng có thể xác minh rằng với các công cụ mạng như Wireshark để đảm bảo rằng nó thực sự chỉ truyền sau đó.


3
Rõ ràng, điều này không còn hoàn toàn đúng nữa: các thiết bị Alexa hiện có thể xác minh từ đánh thức qua đám mây dưới dạng kiểm tra bổ sung, do đó, một từ tương tự như từ đánh thức có thể được gửi lên đám mây.
Aurora0001

12

Là Echo luôn ghi và gửi dữ liệu lên đám mây, hoặc những tuyên bố trên không có căn cứ?

Không có trên gửi. Nhưng có trên ghi âm.

Tôi hiện đang phát triển một khách hàng phần cứng Alexa cho một công ty. Thiết bị luôn luôn lắng nghe. Nhưng bạn phải đặt một công cụ đánh thức cho nó để nó "thức dậy" từ chế độ nghe thụ động và chuyển sang chế độ "nghe lệnh" đang hoạt động.

Phần sụn sẽ chỉ gửi các câu lệnh sau từ đánh thức (chuyển sang chế độ hoạt động) vào đám mây để xử lý chúng dưới dạng các lệnh.

  • Đối với thiết bị có liên quan, bạn sẽ không muốn gửi mọi tuyên bố mà nó đưa vào đám mây để xử lý vì điều đó sẽ tiêu tốn quá nhiều băng thông và năng lượng.
  • Theo như Amazon có liên quan, họ cũng sẽ không muốn mỗi khách hàng Alexa gửi mọi thứ họ nghe được vì điều đó sẽ chiếm một lượng băng thông rất lớn. Hơn nữa, điều đó sẽ dẫn đến quá nhiều dữ liệu không liên quan sẽ gây rối với việc học tập liên tục của hệ thống. Hãy tưởng tượng bạn đang cố gắng học những gì giáo viên của bạn đang nói (các lệnh hợp lệ) khi mọi người trong lớp đang nói cùng một lúc (mọi câu lệnh khác không phải là một lệnh).

Amazon Echo xử lý dữ liệu như thế nào nếu không phải lúc nào cũng gửi dữ liệu đến các máy chủ trong đám mây?

Ở chế độ thụ động, thiết bị có công cụ đánh thức nội bộ, nghe mọi lúc cho từ đánh thức. Trong khi tôi đang thử nghiệm Alexa trong Raspberry Pi, tôi đã phải đưa vào động cơ Sensory hoặc KITT.AI cho mục đích này. Trong thực tế, khi tôi dùng thử mã máy khách Alexa nguyên mẫu cho máy Linux của mình, nó phải là "trò chuyện" vì không có công cụ đánh thức.


Cảm ơn bạn đã chỉ ra về các công cụ đánh thức - gần như chắc chắn là cách tiếp cận mà Amazon đang sử dụng bằng vẻ ngoài của nó. Sự tương đồng của bạn về dữ liệu cũng thực sự tuyệt vời - tôi đánh giá cao nó!
Aurora0001

4

Bằng cách nói một cụm từ quan trọng, Amazon gọi một từ đánh thức tiếng Anh, tiếng Echo trở nên sống động và bắt đầu lắng nghe các lệnh. Theo mặc định, từ đánh thức là Alexa.

Nếu bạn đọc lại câu cuối cùng thì nó có thể không có ý nghĩa, đặc biệt nếu bạn đang ở trong lĩnh vực bảo mật. Theo Amazon, Echo chỉ lắng nghe các lệnh một khi nó nghe thấy từ thức tỉnh của nó. Làm sao nó biết khi bạn đã nói từ đánh thức nếu nó chưa nghe?

Echo lắng nghe tích cực cho từ khóa và lấy các từ được nói sau khi từ khóa để xử lý NLU. Dưới đây là sự hiểu biết của tôi làm thế nào echo đạt được kỳ công gọn gàng này.

Echo được xây dựng trên Bộ xử lý phương tiện kỹ thuật số DM3725 của Texas .

TI SoC này có hai phần chính bên trong, đầu tiên là ARM Cortex-A8 MPU và phần thứ hai là TMS320DM64x + DSP. Lõi ARM nên chạy Linux và DSP đang chạy phần sụn.

Khi chạy không tải, lõi ARM được đưa đến trạng thái năng lượng thấp nhất có thể và Linux hoàn toàn bị treo. Tại thời điểm này, RAM On-Chip DSP và 64KB đang hoạt động. Phần sụn DSP xử lý tiếng ồn phát ra từ mics và cố gắng xác định xem từ khóa (ví dụ: Alexa) có được sử dụng không. Ngay khi nhận ra có một từ khóa, DSP sẽ gửi một ngắt để đánh thức lõi ARM, từ đó nối lại Linux. Nhưng, hãy nhớ, trong khi Linux được thức dậy những con người nói Alexa sẽ vẫn tiếp tục nói chuyện (như trong, “Alexa, mấy giờ rồi?” ). Bộ đệm DSP "mấy giờ rồi?" một phần trên RAM chip. Và khi Linux được nối lại, Linux sẽ tải lời nói được đệm và sử dụng khả năng Xử lý ngôn ngữ tự nhiên (một phần cục bộ, một phần đám mây) để hiểu những gì Con người nói.

Như bạn thấy thiết kế hoàn toàn được tạo ra để ít bị đói nhất và để tránh cần bao gồm đám mây để phát hiện từ khóa và bộ đệm ban đầu. Vì thực tế, việc giữ cho lõi ARM ở trạng thái công suất thấp nhất đảm bảo rằng silicon nóng lên ít nhất khi không hoạt động, do đó mang lại tuổi thọ cho thiết bị của bạn.

Tôi sẽ rời khỏi cuộc thảo luận về các nỗ lực để hack echo như câu hỏi sau đây:

việc nhận biết từ thức tỉnh thực sự được thực hiện tại địa phương.


Làm thế nào khó khăn để đặt phần lớn các lệnh đơn giản như thời gian hoặc chơi trạm cục bộ là mấy giờ? Điều này cũng sẽ loại bỏ thời gian trễ của đám mây.
flyingdrifter

1

Vâng.

Xem, ví dụ, Amazon Echo mới riêng tư như thế nào? (có rất nhiều tương tự được tìm thấy với nỗ lực tối thiểu)

Giống như Siri, Amazon Echo hoạt động trong đám mây trên mạng, chạy trên dịch vụ web của Amazon. Do đó, quá trình xử lý được yêu cầu để có thể hiểu được, lệnh của bạn không được xử lý trên chính thiết bị

Tuy nhiên,

Rốt cuộc, nó luôn luôn lắng nghe, vậy chúng ta có nên quan tâm đến Big Brother không?

Không, Amazon nói. Gã khổng lồ công nghệ nói rằng họ không nghe hoặc ghi lại các cuộc trò chuyện riêng tư trong nhà. Nếu ai đó lo ngại, họ có thể sử dụng điều khiển từ xa đi kèm để nhấn nút tắt tiếng, tắt thiết bị này luôn luôn nghe, vì vậy nó sẽ không hoạt động cho đến khi bạn kích hoạt lại micrô.


Đó là một nguồn tốt, cảm ơn. Nó không đề cập đến bất cứ điều gì về cách thức Echo không nhận ra lệnh trỗi dậy mặc dù nếu nó không phải luôn luôn ghi và gửi dữ liệu, vì vậy tôi muốn được quan tâm để nghe về điều đó khía cạnh hơn.
Aurora0001

Chắc chắn đó là toàn bộ vấn đề? Đó luôn luôn lắng nghe và gửi * tất cả mọi thứ cho đám mây, đó là nơi mà các lệnh wakeup được công nhận. Bạn có cần một trích dẫn cho điều đó?
Mawg

1
Điều đó sẽ hữu ích, vâng (và tôi nghĩ rằng có lẽ thay đổi tổng thể câu trả lời của bạn thành "có, nó luôn luôn lắng nghe"). Cảm ơn.
Aurora0001

1
Tôi không biết có bao nhiêu sức mạnh xử lý trong tiếng vang, nhưng tôi biết smartwatch của tôi có thể phát hiện ra 'ok google' khi nó không bị ràng buộc - từ góc độ tải trên đám mây, việc di chuyển chức năng này sang cạnh một cách hợp lý sẵn sàng - vì vậy câu trả lời có thể thay đổi.
Sean Houlihane

có thể , trong tương lai (nhưng tại sao?), Cho đến bây giờ, nó có vẻ rõ ràng
Mawg
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.