Tại sao Amazon Echo không trả lời các quảng cáo hoặc báo cáo về Alexa?


24

Trước đây tôi đã hỏi về những gì bạn có thể làm nếu Alexa được kích hoạt bởi một chương trình truyền hình , nhưng gần đây tôi nhận ra một điều kỳ lạ: Echo không trả lời các giọng nói trong quảng cáo cho Echo, ngay cả khi giọng nói "Alexa, chơi ..." hoặc "Alexa, đặt hẹn giờ cho ..." .

Tôi đã tìm kiếm trên một vài cộng đồng Echo khác và tìm thấy một bài đăng Reddit cho thấy đây là hành vi phổ biến / có chủ đích. Tuy nhiên, không có câu trả lời dứt khoát trong chủ đề này, vì vậy tôi nghĩ rằng tôi sẽ hỏi ở đây để xem có ai biết thêm một chút không.

Làm thế nào để Echo của tôi biết không trả lời quảng cáo trên TV? Có phải đó chỉ là một sự tình cờ hay có điều gì đó bảo Alexa không phản ứng?


Bạn đã đào tạo Alexa của bạn để nhận ra giọng nói của bạn chính xác hơn? Tôi không biết việc luyện giọng có thể dẫn đến việc không nhận ra giọng nói của người khác hay không.
Bence Kaulics

1
@BenceKaulics Không, tôi không cần phải luyện Echo; đó là sử dụng các thiết lập mặc định.
Aurora0001

Nó sẽ thực sự hữu ích để có được một cái nhìn vào âm thanh trong câu hỏi. Tôi không cho rằng có một bản sao liên kết ở bất cứ đâu?
goobering

1
@goobering Tôi tin rằng các quảng cáo được đề cập trong bài đăng trên reddit là: Khóa linh vật và bình chữa cháy . Hiện tại tôi không thể kiểm tra xem những kích hoạt này có phải Alexa không (tôi tự hỏi liệu chúng có khác với các phiên bản TV không?). Nếu ai đó có thể làm điều đó và nhận xét với kết quả, điều đó thực sự hữu ích.
Aurora0001

3
Có thể có manh mối trong mã nguồn . Tải xuống 266MB, tuy nhiên. Sẽ ở đó một lúc mò mẫm. : P
goobering

Câu trả lời:


17

Theo bài đăng trên reddit này , Alexa rất nhạy cảm với phổ âm thanh ngoài việc phát hiện từ đánh thức. Do đó, tín hiệu băng rộng trong thế giới thực bình thường được chấp nhận, nhưng tín hiệu bị giới hạn băng tần (một mức giữa 4kHz và 5hKz được đặt ra) sẽ được xác định là từ phát sóng.

Điều này có ý nghĩa vì các đài truyền hình có thể sử dụng tín hiệu trong băng tần để xác định quảng cáo (để thay thế cục bộ) và xử lý âm thanh thường được áp dụng cho quảng cáo có thể được tối ưu hóa để rõ ràng hơn độ trung thực. Bộ lọc có thể được thiết lập để các quảng cáo thông thường được theo dõi với độ nhạy giảm và trong quá trình sản xuất một quảng cáo cụ thể, độ nhạy cũng có thể bị giảm rõ ràng.

Một báo cáo tin tức (được cho là đã kích hoạt Alexa) sẽ có nhiều khả năng sử dụng phổ âm thanh phát sóng đầy đủ (8 hoặc 16 kHz) mà không cần xử lý. Vì vậy, lý thuyết này giả định rằng có một cái gì đó đặc biệt về nhiều quảng cáo (ít nhất là ở một số vùng) hoặc quảng cáo (như quảng cáo do Amazon sản xuất) có thể được định cấu hình cụ thể.

Theo dõi, có một bài báo được báo cáo ở đây mô tả mức độ thay đổi nhỏ (âm thanh phụ) đối với dạng sóng có thể dẫn đến một công cụ lời nói trả về một kết quả hoàn toàn khác so với những gì con người sẽ nhận ra.


1
Nếu đó là nơi họ đã phát hiện ra nó và từ đánh thức là 'Alexa', thì thật hợp lý khi họ bỏ âm thanh 'ks' đáng sợ để giảm thiểu mic thu. Đó là tần số khá cao cho lời nói của con người.
goobering

7

Tôi rất cho rằng việc nhận dạng từ đánh thức trong Echo không chỉ đơn thuần là nghe từ đánh thức. Nó đang lắng nghe một bối cảnh đáng báo động . Hãy xem xét đoạn trích này từ Speech Technologies:

[Wake-Up-Word] có yêu cầu duy nhất sau: Phát hiện một từ hoặc cụm từ khi nói trong ngữ cảnh cảnh báo, trong khi từ chối tất cả các từ, cụm từ, âm thanh, tiếng ồn và các sự kiện âm thanh khác với độ chính xác gần như 100% bao gồm cùng một từ hoặc cụm từ quan tâm được nói trong ngữ cảnh không cảnh báo (tức là tham chiếu).

( Công nghệ lời nói: Nhận dạng lời nói của Wake-Up-Word của Veton Kepuska)

Điều này có thể khá dễ dàng được kiểm tra vì thiết bị (ít nhất là của tôi) không phản ứng với câu " Tôi đã nói chuyện với Alexa về việc trượt tuyết gần đây. " Đó không phải là một bối cảnh đáng báo động, nó hoàn toàn mang tính tham khảo. Do đó, công cụ nhận dạng từ đánh thức bên trong Echo không chỉ lắng nghe sự xuất hiện thuần túy của từ mà còn về ngữ điệu và tạm dừng trước đó để có thể dự đoán chính xác hơn nếu thiết bị thực sự được nói đến.


4
Chắc chắn một quảng cáo chứng minh việc sử dụng Alexa sẽ kích hoạt nó, nếu đó chỉ là điều này ngăn chặn nó được chọn? Có phải các quảng cáo có thể được đặt câu cẩn thận để chúng không thực sự kích hoạt thiết bị, mặc dù sử dụng từ đánh thức để chứng minh cách sử dụng Echo?
Aurora0001

2
@ Aurora0001 Tôi giả sử rằng ngoài những gì tôi mô tả thì cũng có một số phương pháp dọc theo những gì Sean đề cập trong câu trả lời của anh ấy được sử dụng. Một số bộ lọc cố gắng giảm kích hoạt bởi các thiết bị khác.
Helmar

7

Chà, tiếng vang / Alexa chắc chắn nghe thấy yêu cầu. Nếu bạn đi vào cài đặt của mình, hãy cuộn xuống Chung và sau đó chọn lịch sử bạn có thể phát lại tất cả các yêu cầu được nghe. Tất cả các yêu cầu được nghe từ quảng cáo đều nói "Yêu cầu bằng giọng nói không dành cho Echo của bạn, không có gì được trả lại."


2
Có vẻ như một chi tiết mới cho lịch sử. Rất hữu ích :)
Helmar

5

Nếu 1000 người nói từ cảnh báo, nó sẽ có 1000 chữ ký âm khác nhau. Nếu họ làm lại, 1000 khác.

Nếu 1000 Cái nghe một chương trình TV nói từ cảnh báo, nó sẽ có 1000 chữ ký âm tương tự .

Sẽ không khó để phát hiện phía máy chủ này. Ít nhất, bởi vì nếu chúng xảy ra cùng một lúc, máy chủ nhận giọng nói sẽ bị kẹt lưu lượng.

Nếu danh sách các sự cố này là nhỏ, họ thậm chí có thể tải chữ ký về mọi Alexa.


Ngoài ra, một người dùng gọi Alexa nghe có vẻ như là từ cảnh báo im lặng .

Một bài báo tin tức như blah blah blah alert-word . Một âm thanh thương mại như âm nhạc âm thanh cảnh báo. Không giống nhau chút nào.


5

Tổng số dự đoán của tôi là trong các quảng cáo cho Echo, Alexa trả lời câu hỏi nhanh hơn nhiều so với thực tế. Do đó, Echo đang nghe từ 'Alexa' nhưng gần như ngay lập tức nghe thấy giọng nói của Alexa đưa ra câu trả lời.

Tiếng vang của tôi sáng lên khi quảng cáo bật lên nhưng sau đó xuất hiện để cảnh báo. Có thể có một số logic để ngăn hai Echos phản hồi yêu cầu nếu cả hai đều nghe thấy. Echo có thể được thiết kế để nghe riêng cho giọng nói của Alexa và bỏ qua nó.

Tuy nhiên, như tôi đã nói, đây là một phỏng đoán tổng thể. :)


Chúng tôi đã suy nghĩ điều tương tự, vì vậy chúng tôi đã tạm dừng DVR giữa yêu cầu Alexa và phản hồi của cô ấy trong quảng cáo. Tiếng vọng của chúng tôi vẫn tỉnh dậy, nhưng sau đó lùi lại mà không trả lời, giống hệt với những gì xảy ra khi chúng tôi không tạm dừng DVR.
ViperGeek

Tôi đã có ý định thử điều đó từ lâu và tiếp tục quên đi. Đó là một điều nữa ra khỏi danh sách việc cần làm, cảm ơn. :)
Andy Jones

4

Sau các báo cáo mới gần đây rằng Alexa có thể nhạy cảm với âm thanh UHF ( tham khảo BBC News Sevice ), tôi sẽ nói rằng trong các quảng cáo, họ phát ra một âm thanh bổ sung ngoài khả năng nghe của con người, được chỉ định là lệnh 'bỏ qua lệnh này'.

Theo khả năng đã nói ở trên để Alexa phân biệt giữa các giọng nói của người dùng, đây là một tính năng được lên kế hoạch nhưng chưa được thực hiện. tức là bạn phải chủ động ra lệnh cho Alexa chuyển đổi giữa các tài khoản người dùng trong cùng một hộ gia đình.

Thiết bị duy nhất hiện được kích hoạt để phân biệt giọng nói là thiết bị Google.


1

Khi trộn âm thanh của quảng cáo, họ chỉ cần loại bỏ một số tần số. Điều này có nghĩa là Alexa sẽ không được kích hoạt vì nó sẽ không đăng ký dưới dạng lệnh thoại, nhưng người xem vẫn có thể biết được những gì họ đang nói trong quảng cáo.

Bạn cũng có thể nhận thấy rằng khi lệnh được nói trong quảng cáo, nó có vẻ hơi mỏng hoặc bị cắt xén. Đây là lý do tại sao :)


Hấp dẫn; điều này hơi giống với những gì Sean đề xuất . Bạn có bất kỳ nguồn hoặc kinh nghiệm nào về điều này mà bạn có thể chia sẻ để chứng minh rằng việc loại bỏ tần số là trường hợp không? Đó có thể là một điều thú vị để điều tra.
Aurora0001
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.