Tôi có một bộ dữ liệu các sự kiện đã xảy ra trong cùng một khoảng thời gian. Mỗi sự kiện có một loại (có ít loại khác nhau, ít hơn mười) và một vị trí, được biểu thị dưới dạng điểm 2D.
Tôi muốn kiểm tra xem có bất kỳ mối tương quan giữa các loại sự kiện, hoặc giữa loại và địa điểm. Ví dụ: có thể các sự kiện loại A thường không xảy ra khi các sự kiện loại B làm. Hoặc có thể trong một số khu vực, chủ yếu là các sự kiện loại C.
Tôi có thể sử dụng loại công cụ nào để thực hiện việc này? Là người mới trong phân tích thống kê, ý tưởng đầu tiên của tôi là sử dụng một loại PCA (Phân tích thành phần chính) trên tập dữ liệu này để xem mỗi loại sự kiện có thành phần riêng hay có thể một số chia sẻ giống nhau (nghĩa là có tương quan) không?
Tôi phải đề cập rằng tập dữ liệu của tôi có thứ tự 500.000 điểm , do đó làm cho mọi thứ khó xử lý hơn một chút.
EDIT: Như đã lưu ý trong các câu trả lời dưới đây và các ý kiến, cách để đi là mô hình hóa điều này như một quy trình điểm được đánh dấu, và sau đó sử dụng R để thực hiện tất cả các công việc nặng, như được giải thích chi tiết trong báo cáo hội thảo này: http: / /www.csiro.edu.au/resource/Spatial-Point-Potypes-in-R.html