Tại sao chúng ta đối phó với các hàm riêng của tự động tương quan thay vì dữ liệu?


8

Làm thế nào trực giác để hiểu tại sao các hàm riêng của ma trận tự tương quan được sử dụng, nhưng các hàm riêng của ma trận được xây dựng từ các mẫu tạm thời không có ý nghĩa và không được sử dụng? Ví dụ, trong việc phát hiện tín hiệu hài hòa trong nhiễu phụ gia.

Câu trả lời:


5

Một số lý do "mức độ ruột" tại sao tốt hơn là làm việc với ma trận tự tương quan thay vì ma trận với các quan sát của bạn:

  • Nếu bạn muốn tính đến tất cả các quan sát của mình và bạn có rất nhiều dữ liệu, cuối cùng bạn sẽ thao túng (đảo ngược, nhân lên) các ma trận khá lớn. Nếu bạn làm việc với ma trận tự tương quan, bạn sẽ "tóm tắt" dữ liệu của mình một lần (trong một bước khá hiệu quả chỉ cần một FFT và FFT nghịch đảo), và sau đó, bạn chỉ cần thao tác ma trận tự tương quan có kích thước trong đó là thứ tự mô hình của bạn (ví dụ cho mô hình AR hoặc mô hình hình sin).PP×PP
  • Với một số dữ liệu, nó không hoạt động bằng số để sử dụng các quan sát thô vì bạn gặp phải tình huống phải xử lý các ma trận không được đảm bảo là xác định dương.

Ví dụ, chúng ta hãy xem xét hai cách tiếp cận để phù hợp với mô hình AR.

Sử dụng trực tiếp ma trận dữ liệu

Lỗi tái cấu trúc bậc hai theo kinh nghiệm trên dữ liệu của bạn là:

ε= =xTx+xTΓmột+mộtTΓTx+mộtTΓTΓmột

Trong đó là vectơ của các hệ số AR, là vectơ quan sát của bạn và ma trận với các quan sát bị trì hoãn của bạn. Bạn cần tìm giá trị của để giảm thiểu điều này. Sau khi phái sinh và một chút xáo trộn, giải pháp của bạn trông như thế này:x Γ amộtxΓmột

một= =-(ΓTΓ)-1ΓTx

Và bạn bị lừa bởi vì bạn hoàn toàn không có gì đảm bảo rằng có thể được đảo ngược. Trong quá trình, nói một cách số lượng, bạn phải đối phó với các sản phẩm ma trận khá lớn nếu bạn có một chuỗi dài các quan sát.ΓTΓ

Xem quá trình ngẫu nhiên

nếu bạn điều chỉnh góc "quá trình ngẫu nhiên" cho vấn đề, số lượng bạn phải giảm thiểu (giá trị dự kiến ​​của lỗi) là:

ε= =rx(0)+2rmột+mộtTRmột

Và bạn kết thúc với giải pháp hợp lý hơn:

một= =-R-1r

R

Có vẻ như vấn đề của bạn là mô hình hình sin (chứ không phải mô hình AR). Có rất nhiều vẫy tay ở đây, nhưng những gì tôi đã nói về mô hình AR và những trở ngại của việc sử dụng ma trận dữ liệu thô; cũng áp dụng cho mô hình hình sin - với phân tách eigenvalue là hoạt động có vấn đề thay vì đảo ngược ma trận.


2

Đầu tiên, các hàm riêng và giá trị riêng được định nghĩa cho các toán tử. Tương quan là một hoạt động.

Thứ hai, các hàm riêng của tự tương quan đặc biệt thú vị bởi vì chúng giải thích hiệu quả nhất phương sai của tín hiệu trong hồi quy tuyến tính. Nói cách khác, đối với một số vectơ cố định, việc chọn các hàm riêng sẽ giảm thiểu sai số bình phương trung bình trong đó tín hiệu được mô hình hóa thành tổng tuyến tính của vectơ. Kỹ thuật này được gọi là phân tích thành phần chính .

Nếu bạn có thể mở rộng khái niệm về tín hiệu "hài hòa", có lẽ tôi có thể bình luận thêm.


Có, và tôi có thể thêm, người ta cũng có thể làm việc với ma trận dữ liệu trong phân tích thành phần chính. Tuy nhiên, điều này liên quan đến phân rã giá trị số ít thay thế.
Bryan
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.