Tôi muốn một lời khuyên về một phương pháp phân tích mà tôi đang sử dụng, để biết liệu nó có hợp lý không.
Tôi đã đo hai quy trình điểm và và tôi muốn xác định nếu các sự kiện trong bằng cách nào đó tương quan với các sự kiện trong .
Một trong những phương pháp mà tôi đã tìm thấy trong tài liệu là xây dựng biểu đồ tương quan chéo: với mỗi chúng tôi thấy độ trễ cho tất cả các sự kiện của rơi vào một cửa sổ thời gian nhất định (trước và sau ), và sau đó chúng tôi xây dựng một biểu đồ cho tất cả các độ trễ này.
Nếu hai quá trình không tương quan với nhau, tôi sẽ mong đợi một biểu đồ phẳng, vì xác suất có một sự kiện trong sau (hoặc trước) một sự kiện trong là bằng nhau ở tất cả các độ trễ. Mặt khác, nếu có một đỉnh trong biểu đồ, điều này cho thấy quá trình hai điểm bằng cách nào đó có ảnh hưởng lẫn nhau (hoặc, ít nhất, có một số đầu vào chung).
Bây giờ, điều này tốt và tốt, nhưng làm cách nào để xác định xem biểu đồ có đạt đỉnh hay không (tôi phải nói rằng đối với tập dữ liệu cụ thể của tôi, chúng rõ ràng bằng phẳng, nhưng vẫn tốt nếu có cách thống kê xác nhận điều đó)?
Vì vậy, đây là những gì tôi đã làm: Tôi đã lặp lại quá trình tạo biểu đồ trong vài (1000) lần giữ như hiện tại và sử dụng phiên bản "xáo trộn" của . Để xáo trộn T ^ 2 Tôi tính các khoảng giữa tất cả các sự kiện, trộn chúng và tổng hợp chúng để khôi phục một quy trình điểm mới. Trong RI chỉ cần làm điều này với:
times2.swp <- cumsum(sample(diff(times2)))
Vì vậy, tôi kết thúc với 1000 biểu đồ mới, điều đó cho tôi thấy mật độ của các sự kiện trong so với .
Đối với mỗi thùng của biểu đồ này (tất cả chúng đều được xử lý theo cùng một cách) tôi tính mật độ 95% của biểu đồ. Nói cách khác, tôi đang nói, chẳng hạn: tại thời điểm trễ 5 ms, trong 95% các quá trình điểm được xáo trộn có xác suất x tìm thấy một sự kiện trong sau một sự kiện trong .
Sau đó, tôi sẽ lấy giá trị 95% này cho tất cả các độ trễ thời gian và sử dụng nó làm "giới hạn tin cậy" (có lẽ đây không phải là thuật ngữ chính xác) để mọi thứ vượt quá giới hạn này trong biểu đồ gốc có thể được coi là "đúng đỉnh điểm ".
Câu 1 : phương pháp này có đúng về mặt thống kê không? Nếu không làm thế nào bạn sẽ giải quyết vấn đề này?
Câu hỏi 2 : một điều khác mà tôi muốn thấy là liệu có loại tương quan "dài hơn" của dữ liệu của tôi không. Chẳng hạn, có thể có những thay đổi tương tự về tỷ lệ sự kiện trong hai quy trình điểm (lưu ý rằng chúng có thể có tỷ lệ khá khác nhau), nhưng tôi không chắc làm thế nào để làm điều đó. Tôi đã nghĩ đến việc tạo ra một "phong bì" của mỗi quy trình điểm bằng cách sử dụng một số loại hạt nhân làm mịn và sau đó thực hiện phân tích tương quan chéo của hai phong bì. Bạn có thể đề nghị bất kỳ loại phân tích có thể khác?
Cảm ơn và xin lỗi vì câu hỏi rất dài này.