Nếu bạn đọc về các nguyên tắc của phản ứng tổng hợp cảm biến, bạn sẽ luôn có được ước tính tốt hơn khi bạn kết hợp dữ liệu theo đúng cách. Ví dụ: nếu bạn đang đo nhiệt độ trong phòng có 3 cảm biến nhiệt độ khác nhau, không lý tưởng khi chỉ sử dụng cảm biến tốt nhất. Trường hợp lý tưởng sẽ là tạo ra sự kết hợp có trọng số của từng cảm biến, trong đó trọng lượng của cảm biến tỷ lệ với một so với phương sai của cảm biến đó. Chưa kể, dữ liệu đo hình là RẤT tốt. Đó là việc khai thác các mốc gây ồn ào và rất có thể sẽ có phương sai cao hơn.
Nếu bạn nghĩ về nó từ một quan điểm cấp cao, bạn cũng cần phải có một bản cập nhật chuyển động dựa trên hình học. Nếu bạn chỉ sử dụng các mốc, thì bạn sẽ có những trường hợp mơ hồ. Lấy ví dụ, trường hợp bạn chỉ xác định một mốc. Bạn sẽ có một khoảng cách z từ robot của bạn đến mốc, nhưng điều này sẽ ánh xạ tới vô số điểm trong một vòng tròn quanh mốc. Nếu bạn xác định các mốc không, thì bạn không thể làm gì được! Bằng cách bao gồm đo hình, chúng ta không còn mơ hồ. Giả sử chúng ta đang định vị trong mặt phẳng 2D (x, y), thì bạn sẽ phải đảm bảo rằng bạn đã đọc được ít nhất 3 cột mốc để định vị vị trí của bạn mà không cần đo hình và bạn không thể đảm bảo điều đó trong môi trường bình thường.
Cuối cùng, một bộ mã hóa có thể được lấy mẫu theo thứ tự 50Hz, trong khi LIDAR chỉ có thể được lấy mẫu ở khoảng 6-7Hz (đừng trích dẫn tôi về các tần số đó). Điều này có nghĩa là bạn có thể cập nhật vị trí hiện tại của mình thường xuyên hơn thông qua đo hình so với bạn có thể đọc từ cảm biến. Điều này thậm chí không tính đến việc bạn mất bao lâu để xử lý việc đọc cảm biến để xác định các mốc!