Điều gì gây ra một mô hình hình chữ U trong biểu đồ tương quan không gian?


12

Tôi đã nhận thấy trong công việc của mình mẫu này khi kiểm tra một biểu đồ tương quan không gian ở các khoảng cách khác nhau, một mẫu hình chữ U trong các mối tương quan xuất hiện. Cụ thể hơn, tương quan tích cực mạnh mẽ ở các thùng khoảng cách nhỏ giảm theo khoảng cách, sau đó đến một hố tại một điểm cụ thể sau đó leo lên trở lại.

Dưới đây là một ví dụ từ blog Sinh thái bảo tồn, sân chơi vĩ mô (3) - Tự động tương quan không gian .

Moran của tôi Correlogram

Những tương quan tự động tích cực mạnh mẽ hơn ở khoảng cách lớn hơn về mặt lý thuyết vi phạm luật địa lý đầu tiên của Tobler, vì vậy tôi hy vọng nó sẽ được gây ra bởi một số mô hình khác trong dữ liệu. Tôi hy vọng chúng sẽ đạt 0 ở một khoảng cách nhất định và sau đó di chuyển xung quanh 0 ở các khoảng cách xa hơn (đó là những gì thường xảy ra trong các ô chuỗi thời gian với các điều khoản AR hoặc MA bậc thấp).

Nếu bạn thực hiện tìm kiếm hình ảnh google, bạn có thể tìm thấy một vài ví dụ khác về cùng loại mẫu này (xem ở đây để biết một ví dụ khác). Một người dùng trên trang web GIS đã đăng hai ví dụ trong đó mẫu xuất hiện cho I của Moran nhưng không xuất hiện cho Geary C ( 1 , 2 ). Kết hợp với công việc của riêng tôi, các mẫu này có thể quan sát được đối với dữ liệu gốc, nhưng khi khớp một mô hình với các điều khoản không gian và kiểm tra các phần dư chúng dường như không tồn tại.

Tôi đã không bắt gặp các ví dụ trong phân tích chuỗi thời gian hiển thị một biểu đồ ACF tương tự, vì vậy tôi không chắc mẫu nào trong dữ liệu gốc sẽ gây ra điều này. Scortchi trong bình luận này suy đoán rằng một mô hình hình sin có thể được gây ra bởi một mô hình theo mùa bị bỏ qua trong chuỗi thời gian đó. Có thể cùng một loại xu hướng không gian gây ra mô hình này trong một tương quan không gian? Hay đó là một số yếu tố khác của cách tính tương quan?


Đây là một ví dụ từ công việc của tôi. Mẫu khá lớn và các đường màu xám nhạt là một tập hợp 19 hoán vị của dữ liệu gốc để tạo phân phối tham chiếu (vì vậy người ta có thể thấy phương sai trong đường màu đỏ được dự kiến ​​là khá nhỏ). Vì vậy, mặc dù cốt truyện không hoàn toàn kịch tính như phần đầu tiên được hiển thị, hố và sau đó tăng lên ở khoảng cách xa hơn xuất hiện khá dễ dàng trong cốt truyện. (Cũng lưu ý rằng hố trong mỏ của tôi không âm, như các ví dụ khác, nếu điều đó về mặt vật chất làm cho các ví dụ khác nhau mà tôi không biết.)

nhập mô tả hình ảnh ở đây

Dưới đây là bản đồ mật độ hạt nhân của dữ liệu để xem phân bố không gian đã tạo ra biểu đồ tương quan.

Tội phạm KDE ở DC


1
Tôi không chắc liệu điều này có đúng không, vì vậy tôi không đăng nó dưới dạng câu trả lời, nhưng tôi đoán là ở khoảng cách nhỏ hơn, rất ít quan sát ở gần và những cái rất giống nhau. Ở khoảng cách khiêm tốn, nhiều quan sát trở nên "gần" hơn, nhưng chúng ít giống nhau hơn, do đó, hiệu ứng sẽ bị loại bỏ. Ở khoảng cách lớn, mọi thứ đều ở gần, hiệu ứng lớn nhưng rất xa khiến sao lưu. (Cao năm tuổi để nghiên cứu quê hương của tôi, btw.)I
Sycorax nói Phục hồi Monica

Tôi có thể thấy nơi đó đến từ @ user777, mặc dù tôi có thể mong đợi một đối số tương tự sẽ khiến cho cốt truyện có xu hướng về 0 vì sự bất thường của vùng lân cận không gian trở nên lớn hơn. Đó là, khi khu phố phát triển lớn hơn, nghĩa là khu phố sẽ gần với nghĩa lớn hơn. Trong đầu tôi (tôi nghĩ) điều đó sẽ làm cho mối tương quan đi về 0, mặc dù không phải là một, nhưng tôi có thể dễ dàng sai. (Cũng có thể áp dụng lý lẽ tương tự cho chuỗi thời gian và tôi không nhớ đã thấy bất kỳ lô ACF nào cho chuỗi thời gian giống như thế này.)
Andy W

Kde của DC nhắc nhở tôi một chút về bàn cờ. Âm mưu tự tương quan không gian từ bàn cờ sẽ như thế nào? Tôi tự hỏi nếu nó sẽ không cao ở khoảng cách gần (cùng một hình vuông), thấp hơn một chút (hình vuông khác nhau), và sau đó cao hơn một lần nữa. Tôi không biết đủ về chủ đề này để biết nếu đó là câu trả lời.
gung - Tái lập Monica

@gung, nó phụ thuộc vào cách bạn hình thành khoảng cách trong trường hợp đó. Đối với một bàn cờ với sự liên tục của nữ hoàng, nó đồng nghĩa với một thuật ngữ tự động hồi quy âm, trong một chuỗi thời gian sẽ làm cho một âm mưu ACF thay thế giữa tương quan tích cực và tiêu cực (và sóng sẽ giảm đi, rất có thể trong trường hợp đó ). Nó phức tạp hơn trong phân tích không gian so với chuỗi thời gian. Tôi sẽ không mô tả mô hình này như một bàn cờ mặc dù.
Andy W

2
Tập dữ liệu của bạn thực sự không có đủ độ bao phủ không gian mà bạn nên ước tính chế độ tự động ở khoảng cách 5 km (toàn bộ khu vực không quá 10 km và bạn thường muốn có một bộ dữ liệu bao gồm nhiều lần chiều dài tương quan.) Có vẻ như tôi đã có ba "đốm" tội phạm cao trong hình dạng gần như hình tam giác, với các đốm cách nhau khoảng 5K và khoảng cách ở giữa. Do đó, không ngạc nhiên khi thấy mối tương quan tích cực ở độ dài đó.
Brian Borchers

Câu trả lời:


4

Giải trình

Một tương quan hình chữ u là một sự xuất hiện phổ biến khi tính toán của nó được thực hiện trên toàn bộ phạm vi của khu vực xảy ra hiện tượng. Nó xuất hiện đặc biệt với các hiện tượng giống như vết loang trong tự nhiên, chẳng hạn như ô nhiễm cục bộ trong đất hoặc nước ngầm hoặc, như trong trường hợp này, khi hiện tượng này liên quan đến mật độ dân số thường giảm dần về ranh giới của khu vực nghiên cứu (Quận Columbia, nơi có lõi đô thị mật độ cao và được bao quanh bởi các vùng ngoại ô mật độ thấp hơn).

Hãy nhớ lại rằng biểu đồ tương quan tóm tắt mức độ tương tự của tất cả các dữ liệu theo mức độ phân tách không gian của chúng. Giá trị cao hơn giống nhau hơn, giá trị thấp hơn ít tương tự. Các cặp điểm duy nhất mà tại đó sự phân tách không gian lớn nhất có thể đạt được là những điểm nằm ở hai phía đối diện của bản đồ. Do đó, biểu đồ tương quan là so sánh các giá trị dọc theo ranh giới với nhau. Khi các giá trị dữ liệu có xu hướng tổng thể giảm về phía biên, biểu đồ tương quan chỉ có thể so sánh các giá trị nhỏ với các giá trị nhỏ. Nó có khả năng sẽ tìm thấy chúng rất giống nhau.

Do đó, đối với bất kỳ hiện tượng không giống nhau nào về mặt không gian, chúng ta có thể dự đoán trước khi thu thập dữ liệu rằng biểu đồ tương quan có thể sẽ giảm cho đến khi đạt được khoảng một nửa đường kính của khu vực và sau đó nó sẽ bắt đầu tăng.

Một hiệu ứng phụ: sự thay đổi ước tính

Một hiệu ứng phụ là có nhiều cặp điểm dữ liệu có sẵn để ước tính biểu đồ tương quan ở khoảng cách ngắn hơn ở khoảng cách xa hơn. Ở khoảng cách trung bình đến dài, "quần thể trễ" của các cặp điểm như vậy giảm. Điều này làm tăng tính biến thiên của biểu đồ tương quan theo kinh nghiệm. Đôi khi sự thay đổi này một mình sẽ tạo ra các mẫu bất thường trong biểu đồ tương quan. Rõ ràng là một tập dữ liệu lớn đã được sử dụng trong hình trên ("Moran's I"), làm giảm hiệu ứng này, nhưng dù sao sự gia tăng tính biến đổi thể hiện rõ ở biên độ lớn hơn của dao động cục bộ trong âm mưu ở khoảng cách ngoài 3500 hoặc hơn: chính xác là một nửa khoảng cách tối đa.

Do đó, một quy tắc lâu dài trong thống kê không gian là tránh tính toán biểu đồ tương quan ở khoảng cách lớn hơn một nửa đường kính của khu vực nghiên cứu và tránh sử dụng khoảng cách lớn như vậy để dự đoán (như nội suy).

Tại sao định kỳ không gian không phải là câu trả lời đầy đủ

Các tài liệu về thống kê không gian thực sự lưu ý rằng các mô hình định kỳ không gian có thể gây ra sự phục hồi trong biểu đồ tương quan ở khoảng cách lớn hơn. Các nhà địa chất khai thác gọi đây là "hiệu ứng lỗ." Một lớp các biến thể kết hợp với một thuật ngữ hình sin tồn tại để mô hình hóa nó. Tuy nhiên, tất cả các phép ghi âm này cũng áp đặt một số phân rã mạnh theo khoảng cách, và do đó không thể giải thích cho sự trở lại cực đoan của mối tương quan đầy đủ được hiển thị trong hình đầu tiên. Hơn nữa, ở hai chiều trở lên, không thể có hiện tượng là cả hai đẳng hướng (trong đó các biểu đồ tương quan hướng đều giống nhau) và định kỳ. Do đó, tính định kỳ của dữ liệu sẽ không tính đến những gì được hiển thị.

Những gì có thể được thực hiện

Cách chính xác để tiến hành trong những trường hợp như vậy là chấp nhận rằng hiện tượng này không ổn định và chấp nhận một mô hình mô tả nó theo một số hình dạng xác định cơ bản - một "sự trôi dạt" hoặc "xu hướng" - với những biến động bổ sung xung quanh sự trôi dạt đó trong đó có thể có tự tương quan không gian (và thời gian). Một cách tiếp cận khác đối với dữ liệu như số tội phạm là nghiên cứu một biến liên quan khác nhau, chẳng hạn như tội phạm trên mỗi đơn vị dân số.


Cảm ơn bạn, bạn có nghĩ rằng một số trọng số đặc biệt cho hiệu ứng cạnh được kêu gọi không? . Dân số không thực sự là cơ sở quan tâm - nó giống như việc đi bộ xung quanh dân số. Các khu vực nội thành này có thể bị sưng lên rất nhiều (20 ~ 30 lần) trong một số giờ nhất định và liên quan nhiều hơn đến các tổ chức phi dân cư (công việc và giải trí).
Andy W

Andy có rất nhiều sự lựa chọn, bởi vì không có cách nào để xác định một mô hình duy nhất: bạn cần quyết định nơi bạn muốn dừng mô hình hóa các giá trị theo độ trôi của không gian và bắt đầu mô hình hóa chúng (hay đúng hơn là phần dư của chúng) với một mô hình không gian ngẫu nhiên. Biểu đồ tương quan hình chữ u có thể được hiểu là một dấu hiệu mạnh mẽ cho thấy một số cơ chế mô hình hóa sự trôi dạt là cần thiết. Bình thường hóa bởi một dân số có liên quan (ngay cả khi nó chỉ có thể được ước tính thô) là một phương pháp có sẵn cho bạn. Bao gồm các biện pháp dân số (hoặc sử dụng, v.v.) như hiệp phương sai là một cách khác.
whuber

Tôi đã đến gần chỉ bằng một loạt các biện pháp sử dụng đất hoạt động (quán bar, trạm xăng, bệnh viện, trường học, v.v.) cộng với các điều khoản không gian. Dưới đây là bản đồ của các dự đoán giữ các hiệp phương sai khác không đổi . Vẫn còn một chút tương quan tự động còn lại. Tôi nghi ngờ về lỗi lập bản đồ dân số đến các địa điểm nhỏ sẽ giúp ích được bao nhiêu, nhưng tôi tưởng tượng rằng tôi sẽ thực hiện phân tích đó cuối cùng.
Andy W

Đó là một cách tiếp cận nguyên tắc: hãy để lý thuyết hướng dẫn sự phát triển của thành phần trôi dạt của mô hình và sau đó đánh giá các phần dư để quyết định xem liệu nó có đáng để xử lý sự cố tương quan không gian của chúng hay không. Trong nhiều trường hợp, hầu hết các mối quan hệ không gian rõ ràng được giải thích thỏa đáng bằng các thuật ngữ trôi dạt và rất hiếm khi cần máy móc địa lý đầy đủ. Một khía cạnh hấp dẫn của vấn đề của bạn là số liệu cơ bản (khoảng cách không gian) có thể được cho là thời gian di chuyển hoặc khoảng cách di chuyển dọc theo mạng lưới đường phố chứ không phải khoảng cách Euclide.
whuber
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.