Các công cụ thống kê tiêu chuẩn là hệ số tương quan (xem câu trả lời của Michael Chernick) là một giá trị giữa [-1,1] và là đơn vị độc lập. Liên quan đến hệ số tương quan là hiệp phương sai. Hiệp phương sai bị ảnh hưởng bởi các đơn vị nhưng có thể dễ giải thích hơn. Tuy nhiên, tôi không thích một trong những lựa chọn đó trong trường hợp chung. Tôi không thích chúng bởi vì chúng không phải là sự biến đổi độc lập. Hãy xem xét rằng một đường thẳng hoặc ngang thẳng được coi là phi tuyến tính bởi cả hai biện pháp đó.
Một tùy chọn đơn vị tốt hơn là sử dụng phân rã giá trị số ít (SVD). SVD chia dữ liệu thành các phần thành phần được xếp hạng theo mức độ đóng góp của chúng cho toàn bộ. Do đó, tỷ lệ của số ít nhất so với số ít lớn thứ hai là một số liệu của tuyến tính. Lưu ý, để sử dụng phương pháp này, trước tiên bạn phải tập trung dữ liệu (làm cho tọa độ trung bình X, Y, Z, v.v bằng 0).
Ví dụ: Pts: 1126640.141 233575.2013; 1126630.008 233572,8567; 1126625.829 233572.7434;
1126625.416 233577.3781;
Pts tập trung: 9.792639127 0.656480018; -0.340591673 -1,68817349; -4,519928343 -1.801499913; -4.932119113 2.833193384;
Ma trận SVD, D: 11.86500017 0; 0 3.813448344
Tỷ lệ giá trị số ít 3.111357
Tỷ lệ trên có thể được hiểu một cách đại khái là dữ liệu dài gấp ba lần theo hướng của dòng phù hợp nhất vì nó là tuyến tính chéo.
Đối với giải pháp với các đơn vị có đơn vị và không yêu cầu SVD. Làm một số dòng phù hợp có trung tâm của dòng là một trong các tham số. Sử dụng dữ liệu tập trung ở trên rất đơn giản: dòng pt = 0 0 (luôn luôn là trường hợp cho dữ liệu tập trung) hướng dòng = -0.999956849 -0.009289783
Các vectơ từ tâm của đường thẳng đến mỗi điểm là tọa độ tập trung của các điểm. Tìm độ dài hình chiếu của các vectơ này trên đường thẳng (giá trị tuyệt đối của vectơ chấm theo hướng đường thẳng) và độ dài của thành phần vectơ vuông góc (chiều dài của hướng vectơ chéo). Chiều dài song song, chiều dài vuông góc 9,798315123, 0,565480194; 0,336259742, 1,684936621; 4.536468847, 1.759433021; 4.905586534, 2.878889448;
Tối đa của các phép chiếu song song là sự kéo dài dữ liệu dọc theo đường. Độ dài tối đa của hình chiếu vuông góc là thước đo độ phi tuyến tính. Tỷ lệ của hai là một xấp xỉ của tỷ lệ giá trị số ít ở trên.
Ghi chú 1. Tính bất biến trong tuyến tính là không thể. Hãy xem xét, trong một phép biến đổi affine, chúng ta có thể chia tỷ lệ trừ một trong các trục tọa độ gần bằng 0 (làm cho bất kỳ tập hợp điểm nào thành tuyến tính). Vì vậy, bất biến phù hợp là tốt nhất chúng ta có thể làm. 2. Các phương pháp này KHÔNG ROBUST cho dữ liệu ngoại lệ. 3. Ví dụ là 2D nhưng được khái quát thành N chiều.