Câu trả lời phụ thuộc vào ngữ cảnh : nếu bạn sẽ chỉ điều tra một số lượng nhỏ các phân đoạn (giới hạn), bạn có thể có khả năng chi trả cho một giải pháp tính toán đắt tiền. Tuy nhiên, có vẻ như bạn sẽ muốn kết hợp tính toán này trong một số loại tìm kiếm cho các điểm nhãn tốt. Nếu vậy, sẽ có lợi thế lớn khi có một giải pháp hoặc là tính toán nhanh hoặc cho phép cập nhật nhanh chóng một giải pháp khi phân khúc dòng ứng cử viên bị thay đổi một chút.
Ví dụ: giả sử bạn có ý định tiến hành tìm kiếm có hệ thốngtrên toàn bộ thành phần được kết nối của một đường viền, được biểu diễn dưới dạng một chuỗi các điểm P (0), P (1), ..., P (n). Điều này sẽ được thực hiện bằng cách khởi tạo một con trỏ (chỉ mục vào chuỗi) s = 0 ("s" cho "start") và một con trỏ khác f (cho "kết thúc") là chỉ số nhỏ nhất cho khoảng cách (P (f), P (s))> = 100, và sau đó tiến s trong khoảng cách (P (f), P (s + 1))> = 100. Điều này tạo ra một đa tuyến ứng cử viên (P (s), P (s + 1) ..., P (f-1), P (f)) để đánh giá. Đã đánh giá "mức độ phù hợp" của nó để hỗ trợ nhãn, sau đó bạn sẽ tăng s thêm 1 (s = s + 1) và tiến hành tăng f lên (giả sử) f 'và s thành s' cho đến khi một lần nữa một đa tuyến ứng cử viên vượt quá mức tối thiểu span 100 được sản xuất, đại diện là (P (s '), ... P (f), P (f + 1), ..., P (f')). Làm như vậy, các đỉnh P (s) ... P (s ' Rất mong muốn rằng thể dục có thể được cập nhật nhanh chóng từ kiến thức chỉ các đỉnh bị bỏ và thêm. (Quy trình quét này sẽ được tiếp tục cho đến khi s = n; như thường lệ, f phải được phép "quấn quanh" từ n trở về 0 trong quy trình.)
Xem xét này loại trừ nhiều biện pháp có thể có của thể dục ( trạng thái khúc khuỷnh , tình trạng khúc khuỷu , vv) mà nếu không có thể là hấp dẫn. Điều này dẫn đến chúng tôi ủng hộ các biện pháp dựa trên L2 , vì chúng thường có thể được cập nhật nhanh chóng khi dữ liệu cơ bản thay đổi một chút. Tương tự với Phân tích thành phần chính cho thấy chúng ta giải trí theo biện pháp sau (trong đó nhỏ hơn là tốt hơn theo yêu cầu): sử dụng giá trị nhỏ hơn trong hai giá trị riêng của ma trận hiệp phương saicủa tọa độ điểm. Về mặt hình học, đây là một thước đo độ lệch từ phía bên "điển hình" của các đỉnh trong phần ứng cử viên của đa tuyến. (Một giải thích là căn bậc hai của nó là bán trục nhỏ của elip đại diện cho những khoảnh khắc thứ hai của quán tính của các đỉnh của polyline.) Nó sẽ bằng zero chỉ dành cho bộ đỉnh thẳng hàng; mặt khác, nó vượt quá không. Nó đo độ lệch giữa hai bên trung bình so với đường cơ sở 100 pixel được tạo bởi điểm bắt đầu và kết thúc của một đa tuyến, và do đó có một cách hiểu đơn giản.
Vì ma trận hiệp phương sai chỉ có 2 nhân 2, nên các giá trị riêng được tìm thấy nhanh chóng bằng cách giải một phương trình bậc hai. Hơn nữa, ma trận hiệp phương sai là tổng của các đóng góp từ mỗi đỉnh trong một đa tuyến. Do đó, nó được cập nhật nhanh chóng khi các điểm bị loại bỏ hoặc thêm vào, dẫn đến thuật toán O (n) cho đường viền điểm n: điều này sẽ mở rộng tốt cho các đường viền chi tiết cao được hình dung trong ứng dụng.
Dưới đây là một ví dụ về kết quả của thuật toán này. Các chấm đen là các đỉnh của một đường viền. Đường màu đỏ là đoạn đa tuyến ứng cử viên tốt nhất có độ dài từ đầu đến cuối lớn hơn 100 trong đường viền đó. (Ứng cử viên rõ ràng trực quan ở phía trên bên phải không đủ dài.)