Xác định số lượng vị trí trong thế giới thực từ các báo cáo dựa trên GPS


9

Tôi đang làm việc trên một số phần mềm sẽ xác định vị trí trong thế giới thực (máy quay tốc độ) từ một số báo cáo dựa trên GPS . Một người dùng sẽ lái xe khi báo cáo vị trí, do đó báo cáo rất không chính xác. Để giải quyết vấn đề đó, tôi phải phân cụm các báo cáo về cùng một vị trí và tính trung bình.

Câu hỏi của tôi là về cách phân cụm các báo cáo . Tôi đã đọc về thuật toán tối đa hóa kỳ vọngphân cụm k-nghĩa , nhưng theo tôi hiểu, tôi sẽ cần xác định trước số lượng vị trí thực.

Có bất kỳ thuật toán nào khác, không cần số lượng chính xác của các vị trí thực, mà thay vào đó sử dụng một số điều kiện cạnh (khoảng cách tối thiểu)?

Một báo cáo chứa kinh độ , vĩ độđộ chính xác ( tính bằng mét). Không có tên hoặc bất cứ điều gì khác có thể được sử dụng để xác định các bản sao.

Một trở ngại khác có thể là nó sẽ phổ biến, chỉ có một báo cáo cho một địa điểm trong thế giới thực. Điều đó gây khó khăn cho việc phân biệt các ngoại lệ với dữ liệu tốt.


1
Tôi không chắc ý của bạn là gì khi bạn nói "... như tôi đã hiểu, tôi sẽ cần xác định trước số lượng địa điểm thực ..." Giả sử tôi đã hiểu chính xác về bạn, không có gì trong thuật toán vốn yêu cầu điều này. Có lẽ bạn đang lên kế hoạch tăng số lượng thành phần cụm dựa trên số lượng báo cáo?
Pat

1
Câu hỏi thứ 2 :). Nếu báo cáo của bạn đến từ một người đang lái xe, thì có thể sẽ có những thay đổi đáng kể về vị trí giữa họ. Các báo cáo có kèm theo dấu thời gian cho bạn biết khi nào chúng được thực hiện không?
Pat

2
Chào Pat. Tôi đang nói về ùn tắc giao thông hoặc camera tốc độ để làm cho nó rõ ràng hơn. 1. "k" trong cụm k-có nghĩa là số cụm. Trong trường hợp của tôi, tôi sẽ có một cụm cho mỗi vị trí, trong khi tôi không biết có bao nhiêu vị trí khác nhau. 2. Có, chúng cũng bao gồm dấu thời gian. Nhưng tôi không hiểu tại sao điều đó lại quan trọng, vì tôi chỉ quan tâm đến vị trí.
Christian Strempfer

1
1. À, tôi hiểu rồi. Vì vậy, bạn có một số lượng vị trí không xác định và mỗi vị trí tạo ra một hoặc nhiều báo cáo. Tuy nhiên, tất cả những gì bạn thấy là một luồng báo cáo. Bạn muốn suy luận có bao nhiêu vị trí và vị trí của chúng, dựa trên các báo cáo được quan sát. Tôi đã có nó? 2. Tôi lo lắng về dấu thời gian vì bạn nói rằng người dùng sẽ lái xe khi họ báo cáo. Như vậy, trừ khi các báo cáo xuất hiện liên tiếp rất nhanh hoặc tốc độ rất thấp (có thể, nếu đó là kẹt xe), thì một vị trí sẽ trông giống như một dòng báo cáo rách rưới trên đường. Dấu thời gian có thể giúp bạn ở đây
Pat

1
1. Có, bạn đã có nó. 2. Đây là một nhiệm vụ thủ công, do đó, một địa điểm chỉ nên được báo cáo một lần cho mỗi người dùng trong một chuyến đi. Nhưng bạn đã đúng, tôi phải xử lý các bản sao, khi người dùng vô tình bấm hai lần và các báo cáo sẽ không chính xác khi lái xe nhanh. Đó là lý do tại sao tôi đề cập đến điều kiện cạnh của khoảng cách tối thiểu giữa các vị trí. Hãy bỏ qua ùn tắc giao thông, mà có thể lây lan một số dặm, và cho rằng vị trí là rất nhỏ.
Christian Strempfer

Câu trả lời:


1

Tôi đã tìm thấy một phần mềm có thể có thể giúp bạn. Có vẻ như ai đó có cùng một vấn đề mà bạn và họ đã đưa ra cho anh ấy một giải pháp trong diễn đàn này , vì vậy bạn sẽ cần sử dụng ArcGIS, nhưng nếu bạn đang tìm kiếm một thuật toán họ đề xuất bài báo này . Tôi nghĩ rằng bài báo đủ chi tiết để là một khởi đầu tốt cho thuật toán của bạn.


2
Bởi vì tất cả thông tin là câu trả lời này nằm trong các liên kết của nó và các liên kết cuối cùng sẽ bị thối rữa, ít nhất xin vui lòng tóm tắt những gì diễn đàn và bài viết đề xuất.
whuber
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.