Các trái đất mover khoảng cách , còn được gọi là Wasserstein số liệu, biện pháp khoảng cách giữa hai biểu đồ. Về cơ bản, nó coi một biểu đồ là một đống bụi bẩn và sau đó đánh giá một lượng bụi bẩn cần di chuyển và khoảng cách (!) Để biến biểu đồ này thành biểu đồ khác. Bạn sẽ đo khoảng cách giữa phân phối của bạn và đồng phục trong các ngày trong tuần.
Điều này tất nhiên chiếm phần gần của ngày - việc di chuyển "bụi bẩn" từ thứ Hai sang thứ Ba dễ dàng hơn từ thứ Hai đến thứ Năm, vì vậy (1 / 2,0,0,1 / 2,0,0,0) sẽ có khoảng cách động đất thấp hơn từ phân bố đồng đều so với biểu đồ tập trung vào thứ Hai và thứ Ba.
Điều này không làm là xem xét "tính tuần hoàn" trong tuần, tức là thứ bảy và chủ nhật gần nhau như chủ nhật và thứ hai. Đối với điều đó, bạn sẽ cần tìm kiếm một khoảng cách động đất được xác định trên các phân phối khối lượng xác suất tròn . Điều này nên được thực hiện bằng cách sử dụng một phương pháp tối ưu hóa phù hợp.
EDIT: Trong R, emd
gói tính toán khoảng cách động đất giữa các biểu đồ.
Bạn có thể giải quyết vấn đề "tính tuần hoàn" theo cách khá đơn giản (mặc dù đặc biệt).
- Tính khoảng cách di chuyển trái đất giữa phân phối của bạn và phân phối thống nhất vào Thứ Hai đến Chủ Nhật.d1
- Tính khoảng cách so với phân phối đồng đều vào thứ Ba đến thứ Hai.d2
- Tính khoảng cách so với phân phối đồng đều vào Thứ Tư đến Thứ Ba.d3
- ...
- Cuối cùng, là khoảng cách cuối cùng, sử dụng giá trị trung bình của .d1,…,d7
Điều này quan tâm đến tính tuần hoàn với chi phí của một vài tính toán bổ sung.
EDIT thứ 2: đây không phải là khoảng cách động đất tròn như vậy. Vì thế, bạn cần xem qua một số tài liệu mà một tìm kiếm sẽ xuất hiện . Nếu cách tốt nhất để di chuyển bụi bẩn giữa các ngày liên quan đến việc di chuyển nó hai ngày từ Thứ Bảy đến Thứ Hai, thì điều này sẽ hiển thị ở năm trong số bảy , nhưng không phải trong hai ngày còn lại (nơi mà bụi bẩn sẽ cần phải di chuyển năm ngày).di
Tuy nhiên, tôi vẫn coi đây là một cách hữu ích để ít nhất xem xét tính tuần hoàn theo một cách nào đó - chắc chắn tốt hơn là chỉ sử dụng một biểu đồ duy nhất và xác định tuần là từ Chủ nhật đến Thứ bảy hoặc theo một cách tùy tiện khác. Thêm vào đó, trong khi một số liên kết ở trên bật lên các triển khai cho khoảng cách động đất tròn, tôi không biết một liên kết cho R, có lẽ là ngôn ngữ được sử dụng nhiều nhất ở đây.