Đo độ đồng đều của phân bố điểm trong hình vuông 2D


10

Tôi có một hình vuông 2D, và tôi có một tập hợp các điểm bên trong nó, giả sử, 1000 điểm. Tôi cần một cách để xem sự phân bố các điểm bên trong hình vuông có được trải ra (hoặc phân phối đồng đều hơn hoặc ít hơn) hoặc chúng có xu hướng tập hợp lại với nhau tại một số điểm bên trong hình vuông.

Tôi cần một cách toán học / thống kê (không lập trình) để xác định điều này. Tôi googled, tìm thấy một cái gì đó như lòng tốt của sự phù hợp, Kolmogorov, vv, và chỉ tự hỏi nếu có những cách tiếp cận khác để đạt được điều này. Cần điều này cho lớp giấy.

Đầu vào: một hình vuông 2D và 1000 điểm. Đầu ra: có / không (có = trải đều, không = tập hợp lại với nhau ở một số điểm).


1
Bạn chưa nói rõ đủ chính xác những gì "phân phối đồng đều" cho bạn. Bạn có nghĩa là khối đồng đều 2D lát gạch hoặc một cái gì khác? Ví dụ, chuỗi điểm cách đều nhau? hoặc một vòng tròn các điểm? Theo một nghĩa nào đó, những con số này là sự lây lan đồng đều, quá.
ttnphns

3
@ttnphns Trong bối cảnh này, "đồng phục" có một ý nghĩa thông thường được thiết lập tốt. Nó tương ứng với một quá trình Poisson với cường độ không đổi. Nó thường được gọi là "CSR" hoàn toàn ngẫu nhiên về mặt không gian .
whuber

2
@Van Bạn muốn nghiên cứu "quy trình điểm không gian." Các từ khóa tốt bao gồm "Hàm Ripley K", "CSR" và "Poisson". Một tài liệu tham khảo có thể truy cập cho bạn sẽ là O'Sullivan & Unwin, Phân tích thông tin địa lý. Một cổ điển là Ripley, Thống kê không gian : nó tập trung vào các quy trình điểm. Đối với các ứng dụng, hãy xem nhanh CrimeStat . Nếu bạn cảm thấy thoải mái R, có rất nhiều công cụ cho nhiệm vụ này .
whuber

Câu trả lời:


5

Tôi nghĩ rằng ý tưởng của @John về một bài kiểm tra chi = vuông là một cách để đi.

1000N

Nhưng có thể số lượng tế bào khác nhau sẽ đưa ra kết luận khác nhau.

Một khả năng khác là tính khoảng cách trung bình giữa các điểm và sau đó so sánh kết quả này với kết quả mô phỏng của mức trung bình đó. Điều đó tránh được vấn đề về số lượng tế bào tùy ý.

EDIT (nhiều hơn về khoảng cách trung bình)

10009992

Sau đó, bạn có thể tạo N (một số lượng lớn) gồm 1000 điểm được phân phối đồng đều. Mỗi bộ N cũng có khoảng cách trung bình giữa các điểm.

So sánh kết quả cho các điểm thực tế với các điểm mô phỏng, để lấy giá trị p hoặc chỉ để xem chúng rơi ở đâu.


Tôi đồng ý rằng một mẫu chi bình phương ("kiểm tra chi bình phương") là một trong những cách hợp lý. Nhưng bạn có thể nói rõ hơn về đề xuất "khoảng cách avarage" của bạn không? Tôi không hiểu lắm.
ttnphns

@ttnphns, những người sử dụng trong phân tích không gian là những thử nghiệm hàng xóm gần nhất (aka Clark và thử nghiệm Evans), hoặc Ripley của K. Xem R thư viện spatstat hoặc tài liệu CrimeStat cho ví dụ. Một khả năng khác dựa trên mô phỏng là các thử nghiệm "quét", nhưng chúng không dựa trên khoảng cách trung bình.
Andy W

3

Một khả năng khác là một bài kiểm tra Chi-Squared. Chia hình vuông thành các miếng vá không chồng chéo có kích thước bằng nhau và kiểm tra số điểm rơi vào các miếng vá so với số lượng dự kiến ​​của chúng theo giả thuyết về tính đồng nhất (kỳ vọng cho một miếng vá là Total_point / Total_patches nếu chúng đều có kích thước bằng nhau) và áp dụng bài kiểm tra chi bình phương. Đối với 1000 điểm, 9 bản vá là đủ, nhưng bạn có thể muốn sử dụng mức độ chi tiết cao hơn tùy thuộc vào dữ liệu của bạn trông như thế nào.


1
Tôi nghĩ rằng bạn đang tham gia vào một cái gì đó nhưng một sự phù hợp của chi bình phương so sánh số lượng thực tế trong mỗi ô so với số lượng tế bào bằng nhau dự kiến ​​sẽ là những gì bạn muốn. Sử dụng kiểm tra dự phòng sẽ KHÔNG kiểm tra nếu có phân phối đồng đều giữa các ô của bạn, chỉ khi hàng phụ thuộc vào cột.
Giăng

Ngoài ra, kiểm tra chi bình phương sẽ chỉ cho bạn biết nếu chúng không đồng nhất trên các ô bạn đã chọn. Nó sẽ không cho bạn biết nếu chúng là đồng phục.
Giăng

Vâng, tôi có nghĩa là số lượng so với số lượng dự kiến ​​của họ theo một giả thuyết khống về tính đồng nhất, lời xin lỗi của tôi nếu nó không rõ ràng. Bạn chỉ có thể hình dung nó như một bảng giúp hiểu những gì đang diễn ra đối với người không quen! Và rõ ràng là bạn bị giới hạn trong việc kiểm tra các ô bạn chọn thay vì tính đồng nhất theo nghĩa trừu tượng
Ben Allison

@ John, thông thường khi một người thực hiện "kiểm tra phân tán" này, người ta thường thực hiện kiểm tra hai mặt. Nếu bạn thực sự muốn xem liệu mô hình có đồng đều hơn mong đợi hay không, bạn có thể chỉ cần nhìn xem thử nghiệm chi bình phương có rơi vào đuôi bên trái của phân phối không (ở bất kỳ mức độ cắt nào bạn thích).
Andy W

Andy, bạn nên cung cấp một câu trả lời chi tiết về sự tốt đẹp hai mặt của bài kiểm tra phù hợp này. Thông thường, hai thử nghiệm hai mặt chỉ kiểm tra hai lựa chọn thay thế khác nhau thành null nhưng vẫn không thể chứng minh null. Đề xuất của bạn là hấp dẫn.
Giăng

1

Tại sao không sử dụng thử nghiệm Kolmogorov-Smirnov? Đó là những gì tôi sẽ làm, đặc biệt là xem xét rằng kích thước mẫu của bạn đủ lớn để bù đắp cho việc thiếu năng lượng.

Ngoài ra, bạn có thể làm một số mô phỏng. Nó không nghiêm ngặt, nhưng nó cung cấp một số bằng chứng về việc dữ liệu có được phân phối đồng đều hay không.


@whuber Phần mở rộng 2 chiều của KS được biết đến (xem tại đây ). Trong trường hợp này, chúng tôi đang nghiên cứu xem 1000 bản vẽ (tọa độ (x, y)) này có thể được rút ra từ phân phối đồng đều 2 chiều hay không - ít nhất đó là cách tôi đọc "trải đều". @ John Tôi có thể đã thể hiện bản thân một cách vụng về (cả toán học lẫn tiếng Anh đều không phải là ngôn ngữ đầu tiên của tôi). Ý tôi là giá trị p chính xác có thể được tính bằng cách sử dụng một bài kiểm tra như KS, trong khi giá trị p (hoặc bất cứ thứ gì bạn gọi là tương đương) chỉ có xu hướng không có triệu chứng khi thực hiện mô phỏng.


Tại sao mô phỏng sẽ không nghiêm ngặt?
Giăng

1
Bạn có thể giải thích cách kiểm tra KS - được dành cho các bộ số thực được coi là kết quả của một biến ngẫu nhiên liên tục - sẽ được áp dụng cho bộ dữ liệu không gian này không ?
whuber

@whuber Tôi đã chỉnh sửa câu trả lời của mình để thử và cung cấp câu trả lời cho câu trả lời của bạn. Tốt.
abaumann

@ John Tôi đã cố gắng giải thích những gì tôi có ý nghĩa. Tốt.
abaumann
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.