Phân tích mối tương quan chéo giữa các quá trình điểm


15

Tôi muốn một lời khuyên về một phương pháp phân tích mà tôi đang sử dụng, để biết liệu nó có hợp lý không.

Tôi đã đo hai quy trình điểm và và tôi muốn xác định nếu các sự kiện trong bằng cách nào đó tương quan với các sự kiện trong .T1= =t11,t21,...,tn1T2= =t12,t22,...,tm2T1T2

Một trong những phương pháp mà tôi đã tìm thấy trong tài liệu là xây dựng biểu đồ tương quan chéo: với mỗi chúng tôi thấy độ trễ cho tất cả các sự kiện của rơi vào một cửa sổ thời gian nhất định (trước và sau ), và sau đó chúng tôi xây dựng một biểu đồ cho tất cả các độ trễ này.tn1T2tn1

Nếu hai quá trình không tương quan với nhau, tôi sẽ mong đợi một biểu đồ phẳng, vì xác suất có một sự kiện trong sau (hoặc trước) một sự kiện trong là bằng nhau ở tất cả các độ trễ. Mặt khác, nếu có một đỉnh trong biểu đồ, điều này cho thấy quá trình hai điểm bằng cách nào đó có ảnh hưởng lẫn nhau (hoặc, ít nhất, có một số đầu vào chung).T2T1

Bây giờ, điều này tốt và tốt, nhưng làm cách nào để xác định xem biểu đồ có đạt đỉnh hay không (tôi phải nói rằng đối với tập dữ liệu cụ thể của tôi, chúng rõ ràng bằng phẳng, nhưng vẫn tốt nếu có cách thống kê xác nhận điều đó)?

Vì vậy, đây là những gì tôi đã làm: Tôi đã lặp lại quá trình tạo biểu đồ trong vài (1000) lần giữ như hiện tại và sử dụng phiên bản "xáo trộn" của . Để xáo trộn T ^ 2 Tôi tính các khoảng giữa tất cả các sự kiện, trộn chúng và tổng hợp chúng để khôi phục một quy trình điểm mới. Trong RI chỉ cần làm điều này với:T1T2T2

times2.swp <- cumsum(sample(diff(times2)))

Vì vậy, tôi kết thúc với 1000 biểu đồ mới, điều đó cho tôi thấy mật độ của các sự kiện trong T2* so với T1 .

Đối với mỗi thùng của biểu đồ này (tất cả chúng đều được xử lý theo cùng một cách) tôi tính mật độ 95% của biểu đồ. Nói cách khác, tôi đang nói, chẳng hạn: tại thời điểm trễ 5 ms, trong 95% các quá trình điểm được xáo trộn có xác suất x tìm thấy một sự kiện trong T2* sau một sự kiện trong T1 .

Sau đó, tôi sẽ lấy giá trị 95% này cho tất cả các độ trễ thời gian và sử dụng nó làm "giới hạn tin cậy" (có lẽ đây không phải là thuật ngữ chính xác) để mọi thứ vượt quá giới hạn này trong biểu đồ gốc có thể được coi là "đúng đỉnh điểm ".

Câu 1 : phương pháp này có đúng về mặt thống kê không? Nếu không làm thế nào bạn sẽ giải quyết vấn đề này?

Câu hỏi 2 : một điều khác mà tôi muốn thấy là liệu có loại tương quan "dài hơn" của dữ liệu của tôi không. Chẳng hạn, có thể có những thay đổi tương tự về tỷ lệ sự kiện trong hai quy trình điểm (lưu ý rằng chúng có thể có tỷ lệ khá khác nhau), nhưng tôi không chắc làm thế nào để làm điều đó. Tôi đã nghĩ đến việc tạo ra một "phong bì" của mỗi quy trình điểm bằng cách sử dụng một số loại hạt nhân làm mịn và sau đó thực hiện phân tích tương quan chéo của hai phong bì. Bạn có thể đề nghị bất kỳ loại phân tích có thể khác?

Cảm ơn và xin lỗi vì câu hỏi rất dài này.

Câu trả lời:


11

Một phương pháp tiêu chuẩn để phân tích vấn đề này theo hai chiều trở lên là hàm K (chéo) của Ripley , nhưng không có lý do gì để không sử dụng nó trong một chiều. . . thường được tạo ra thông qua mô phỏng. Điều này rất dễ thực hiện trong R. Nhiều gói thống kê không gian cho R có thể được sử dụng trực tiếp hoặc sẵn sàng thích ứng với trường hợp 1D này. Roger Bivandtrang tổng quan về CRAN liệt kê các gói này: tham khảo phần "Phân tích mẫu điểm".


Thú vị ... Hiện tại tôi hơi bận, nhưng tôi chắc chắn sẽ xem xét điều đó!
nico
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.