Đây là nỗ lực của tôi.
Lý lịch
Hãy xem xét hai trường hợp sau đây.
- Bạn là một con mắt riêng tư tại một bữa tiệc. Đột nhiên, bạn thấy một trong những khách hàng cũ của mình đang nói chuyện với ai đó, và bạn có thể nghe thấy một số từ nhưng không hẳn, bởi vì bạn cũng nghe thấy một người khác bên cạnh anh ta, tham gia một cuộc thảo luận không liên quan về thể thao. Bạn không muốn đến gần hơn - anh ấy sẽ phát hiện ra bạn. Bạn quyết định lấy điện thoại của đối tác (người bận rộn thuyết phục người pha chế bia không cồn là tuyệt vời) và trồng nó khoảng 10 mét bên cạnh bạn. Điện thoại đang ghi âm và điện thoại cũng ghi lại cuộc nói chuyện của khách hàng cũ cũng như anh chàng thể thao can thiệp. Bạn lấy điện thoại của mình và bắt đầu ghi âm, từ nơi bạn đang đứng. Sau khoảng 15 phút, bạn trở về nhà với hai bản ghi âm: một bản từ vị trí của bạn và bản kia cách khoảng 10 mét. Cả hai bản ghi đều chứa khách hàng cũ của bạn và Mr. Sporty,
- Bạn chụp ảnh một chú chó Labrador Retriever dễ thương mà bạn nhìn thấy bên ngoài cửa sổ. Bạn kiểm tra hình ảnh, và thật không may, bạn thấy một hình ảnh phản chiếu từ cửa sổ giữa bạn và chú chó. Bạn không thể mở cửa sổ (đó là một trong số đó, vâng) và bạn không thể ra ngoài vì bạn sợ anh ta sẽ bỏ trốn. Vì vậy, bạn lấy (vì một số lý do không rõ ràng) một hình ảnh khác, từ một vị trí hơi khác nhau. Bạn vẫn nhìn thấy hình ảnh phản chiếu và con chó, nhưng bây giờ chúng ở các vị trí khác nhau, vì bạn đang chụp ảnh từ một nơi khác. Cũng lưu ý rằng vị trí thay đổi đồng đều cho từng pixel trong ảnh, vì cửa sổ phẳng và không lõm / lồi.
Câu hỏi là, trong cả hai trường hợp, làm thế nào để khôi phục cuộc trò chuyện (trong 1.) hoặc hình ảnh của con chó (trong 2.), đưa ra hai hình ảnh có chứa hai "nguồn" giống nhau nhưng có sự đóng góp tương đối khác nhau từ mỗi nguồn . Chắc chắn đứa cháu có học thức của tôi có thể hiểu điều này!
Giải pháp trực quan
Làm thế nào chúng ta, ít nhất về nguyên tắc, có thể lấy lại hình ảnh của con chó từ một hỗn hợp? Mỗi pixel chứa các giá trị là tổng của hai giá trị! Chà, nếu mỗi pixel được đưa ra mà không có bất kỳ pixel nào khác, trực giác của chúng tôi sẽ chính xác - chúng tôi sẽ không thể đoán được sự đóng góp tương đối chính xác của từng pixel.
Tuy nhiên, chúng tôi được cung cấp một tập hợp các pixel (hoặc các điểm theo thời gian trong trường hợp ghi), mà chúng tôi biết có cùng quan hệ. Ví dụ, nếu trên hình ảnh đầu tiên, con chó luôn mạnh hơn gấp đôi so với hình ảnh phản chiếu và trên hình ảnh thứ hai, nó hoàn toàn ngược lại, sau đó chúng ta có thể có được những đóng góp chính xác. Và sau đó, chúng ta có thể đưa ra cách chính xác để trừ hai hình ảnh trong tay để sự phản chiếu bị hủy bỏ chính xác! [Về mặt toán học, điều này có nghĩa là tìm ma trận hỗn hợp nghịch đảo.]
Đi sâu vào chi tiết
Giả sử bạn có hỗn hợp hai tín hiệu,
Y1=a11S1+a12S2Y2=a21S1+a22S2
và giả sử bạn muốn lấy lại như một chức năng của hai hỗn hợp, . Và cũng giả sử rằng bạn muốn kết hợp tuyến tính: . Vì vậy, tất cả những gì bạn cần làm là tìm ra vectơ tốt nhất và ở đó bạn có nó. Tương tự cho và .S1Y1,Y2S1=b11Y1+b12Y2(b11,b12)S2(b21,b22)
Nhưng làm thế nào bạn có thể tìm thấy nó cho các tín hiệu chung? chúng có thể trông giống nhau, có số liệu thống kê tương tự, v.v ... Vì vậy, giả sử chúng độc lập. Điều đó hợp lý nếu bạn có tín hiệu gây nhiễu, chẳng hạn như nhiễu hoặc nếu hai tín hiệu là hình ảnh, tín hiệu gây nhiễu có thể là sự phản chiếu của một thứ khác (và bạn đã chụp hai hình ảnh từ các góc khác nhau).
Bây giờ, chúng tôi biết rằng và phụ thuộc. Vì chúng tôi có thể không phục hồi chính xác , biểu thị ước tính của chúng tôi cho các tín hiệu này lần lượt là .Y1Y2S1,S2X1,X2
Làm cách nào chúng ta có thể làm cho gần nhất có thể với ? Vì chúng tôi biết cái sau là độc lập, chúng tôi có thể muốn làm cho độc lập nhất có thể, bằng cách nói đùa với các giá trị của . Rốt cuộc, nếu ma trận không thể đảo ngược, chúng ta có thể tìm thấy một số ma trận đảo ngược hoạt động trộn (và nếu nó không thể đảo ngược, chúng ta có thể đóng lại) và nếu chúng tôi làm cho họ độc lập, cơ hội tốt chúng tôi khôi phục của chúng tôiX1,X2S1,S2X1,X2bij{aij}{bij}Si tín hiệu .
{bij}X1,X2
Vì vậy, trước tiên hãy xem xét điều này: nếu chúng ta tổng hợp một số tín hiệu độc lập, không phải Gaussian, chúng ta tạo ra tổng "nhiều Gaussian" hơn các thành phần. Tại sao? do định lý giới hạn trung tâm, và bạn cũng có thể nghĩ về mật độ của tổng hai số độc lập. các biến, đó là tích chập của mật độ. Nếu chúng ta tổng hợp một số độc lập. Biến Bernoulli, phân phối theo kinh nghiệm sẽ ngày càng giống hình dạng Gaussian. Nó sẽ là một Gaussian thực sự? có lẽ không (không có ý định chơi chữ), nhưng chúng ta có thể đo Gaussianity của tín hiệu bằng số lượng nó giống với phân phối Gaussian. Ví dụ, chúng ta có thể đo mức độ tổn thương dư thừa của nó. Nếu nó thực sự cao, nó có lẽ ít Gaussian hơn một người có cùng phương sai nhưng với mức độ tổn thương dư thừa gần bằng không.
{bij}X1,X2{bij}
Tất nhiên, điều này thêm một giả định khác - hai tín hiệu cần phải không phải là Gaussian để bắt đầu.