Một thống kê thích hợp để đo sự tương quan không gian của các điểm với các giá trị nhị phân là gì?


9

Tôi đang cố gắng xác định mức độ tự tương quan không gian trong một tập dữ liệu điểm. Thuộc tính tôi quan tâm là nhị phân (sự hiện diện / vắng mặt của một loài), mà tôi không phù hợp với Moran. Mặt khác, thống kê Count Count, thường được khuyến nghị cho dữ liệu nhị phân hoặc phân loại, dường như không phù hợp với dữ liệu điểm. Nói tóm lại, câu hỏi là: một thống kê thích hợp để đo sự tự tương quan không gian toàn cầu và / hoặc cục bộ của các điểm khi thuộc tính quan tâm là nhị phân?

Câu trả lời:


4

Khẳng định của bạn rằng thống kê Số lượng tham gia không phù hợp với dữ liệu nhị phân là không chính xác. Đây chỉ là vấn đề làm thế nào ma trận trọng số không gian (Wij) được chỉ định. Như trong Morna-I, bạn không thể sử dụng ma trận khoảng cách trong loại phân tích này, tuy nhiên, một ma trận nhị phân thích hợp có thể được tính bằng cách sử dụng cắt khoảng cách. Bạn có thể tạo loại ma trận trọng số không gian này cũng như tiến hành phân tích Tham gia đếm trong thư viện R spdep. Xem các hàm "joincount.test" và joincount.mc (để kiểm tra hoán vị Monte Carlo).


Cảm ơn, Jeffrey. Tổng số rõ ràng là cách để sử dụng dữ liệu nhị phân, nhưng tôi đã thấy một đề xuất (không thể nhớ lại ở đâu, bây giờ) rằng tổng số chỉ phù hợp với dữ liệu khu vực (không phải điểm). Tôi không rõ tại sao bạn không thể tạo ma trận trọng số bằng cách sử dụng ngưỡng khoảng cách và sử dụng số đếm chung, nhưng tôi không thể tìm thấy ví dụ về điều này trong một số tìm kiếm chữ thảo. Có một tài liệu tham khảo bạn có thể cung cấp cho loại sử dụng này?
dùng13706

Đây là một khối lượng lớn tài liệu về Phân tích mô hình điểm. Thống kê Join-Counts không được sử dụng phổ biến và, do đó, không phổ biến lắm trong tài liệu hiện tại. Tôi sẽ quay trở lại làm việc sớm bằng Diggle hoặc Geits. Mục tiêu của bạn trong việc định lượng sự phụ thuộc không gian trong dữ liệu nhị thức là gì? Bạn không thể sử dụng hệ số Tham gia đếm trong một số thứ như hiệu ứng hỗn hợp hoặc mô hình CAR / SAR. Dưới đây là một số nền tảng thú vị về tỷ lệ mô hình chiếm dụng ( en.wikipedia.org/wiki/Scaling_potype_of_occupancy )
Jeffrey Evans

1
RandomForest là một mô hình không tham số và, do đó, không bị ảnh hưởng bởi sự tự tương quan. Mối quan tâm với mô hình này là mối tương quan trong nhóm bootstrap. Thông thường tự động tương quan có thể tạo ra "sự dư thừa" trong dữ liệu của bạn tạo ra sự thiên vị trong Bootstrap. Tôi sẽ xem xét dựa trên (các) phân phối có điều kiện của hiệp phương sai của bạn. Tôi có sẵn mã R "Mật độ xác suất âm mưu theo âm mưu theo nhóm" tại đây: conserveonline.org/workspaces/emt/document/all.html
Jeffrey Evans

1
Ồ, tôi sẽ không khái quát RF là hộp đen hoàn toàn. Đây là thực tế không phải là trường hợp. Mô hình này thường được giới thiệu là "hộp màu xám". Do ảnh hưởng chính của autocorrelation giả định IID trong các phương pháp thường xuyên, nên một khẳng định khá an toàn rằng các giả định không theo tỷ lệ không bị vi phạm.
Jeffrey Evans

1
Chúng tôi đang khái quát hóa số liệu thống kê "không đối xứng". Điều này bao gồm nhiều phương pháp. Nếu bạn nhìn lại các bằng chứng năm 2001 của Brieman, bạn sẽ thấy rằng RF không có sự độc lập. Cuốn sách "Các yếu tố của học thống kê" của Hastie cung cấp một nền tảng thống kê vững chắc cho lý thuyết mẫu liên quan đến các phương pháp học máy. Như đã nêu trước đây, mối quan tâm là mối tương quan trong đoàn thể mà chắc chắn có thể được gây ra bởi giả hành / tự tương quan. Tuy nhiên, đây không phải là một giả định mô hình trong RF. Tuy nhiên, nếu đủ sever, hiệu ứng ròng của bias hoặc overfit rõ ràng là như nhau.
Jeffrey Evans

0

Dữ liệu nhị phân là một trường hợp sử dụng bình thường cho tự động tương quan không gian. Tôi nghĩ rằng hầu hết các cuốn sách phân tích không gian sẽ nói về nó. Tài liệu này có thể giúp đỡ.


1
Trang đầu tiên của tài liệu tham khảo của bạn nhấn mạnh rằng "vị trí dữ liệu là các vùng ", vì vậy có vẻ như nó hoàn toàn không áp dụng cho dữ liệu điểm.
whuber

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.