Tại sao bình thường hóa tập dữ liệu trước khi áp dụng Chuyển đổi tuyến tính trực tiếp


9

Biến đổi tuyến tính trực tiếp (viết tắt là DLT) là một phương pháp ước lượng homography, nó giải quyết hệ thống tuyến tính quá hạn thông qua SVD để tìm một giải pháp dưới ràng buộc . Trên thực tế, nó tìm thấy giải pháp bình phương tối thiểu giúp giảm thiểu \ | Ah - b \ | .

Ah=b
hh=1Ahb

Tôi hiểu ý tưởng cơ bản của thuật toán này, nhưng nên bình thường hóa tập dữ liệu trước khi áp dụng DLT cho nó, và đây là phần giới thiệu về cách thực hiện chuẩn hóa. Có ý kiến ​​cho rằng chuẩn hóa dữ liệu rất quan trọng đối với DLT, nếu không chuẩn hóa thì kết quả từ DLT không ổn định.

Tôi tự hỏi tại sao? Chỉ vì DLT liên quan đến việc giải quyết hệ thống tuyến tính bằng cách sử dụng SVD và A có thể là số ít?

Câu trả lời:


12

Chuẩn hóa về cơ bản là điều kiện tiên quyết để giảm số điều kiện của ma trận A (số điều kiện càng lớn, ma trận càng gần ma trận số ít).

Biến đổi chuẩn hóa cũng được biểu diễn bằng một ma trận trong trường hợp ước lượng homography, và điều này xảy ra có thể sử dụng như một ma trận tiền xử lý tốt. Lý do tại sao điều đó phức tạp hơn và được giải thích ngắn gọn trong cuốn sách H & Z (4.4.4, trang 107: Tại sao việc chuẩn hóa là cần thiết? ) Hoặc chi tiết hơn trong bài báo " Bảo vệ thuật toán tám điểm ".

Nói một cách đơn giản, ma trận bao gồm các sản phẩm có tọa độ hình ảnh có thể có tỷ lệ khác nhau. Nếu tỷ lệ khác nhau theo hệ số , thì các sản phẩm khác nhau theo hệ số .A10102

Dữ liệu tọa độ nguồn và đích thường ồn . Nếu không chuẩn hóa, dữ liệu từ nguồn có thể có hai bậc có phương sai lớn hơn so với từ mục tiêu (hoặc ngược lại).

Ước tính homography thường tìm thấy các tham số theo nghĩa bình phương nhỏ nhất - do đó ước tính thống kê tốt nhất chỉ được tìm thấy nếu phương sai của các tham số là giống nhau (hoặc được biết trước, nhưng thực tế hơn chỉ là bình thường hóa đầu vào).

Người giải quyết trực tiếp không thích các vấn đề có tỷ lệ thấp vì sự không ổn định về số xuất hiện (ví dụ: chia số rất lớn cho một số rất nhỏ dễ dẫn đến tràn số).

Người giải quyết lặp lại đấu tranh với ma trận điều hòa tồi tệ bằng cách cần nhiều lần lặp hơn.

Vì vậy, chuẩn hóa là điều cần thiết không chỉ cho sự ổn định bằng số, mà còn để ước lượng chính xác hơn khi có nhiễu và giải pháp nhanh hơn (trong trường hợp bộ giải lặp).


Và hơn nữa tôi tự hỏi tại sao ma trận tiền điều kiện là ít số ít hơn trước? Bằng cách tiêu chuẩn hóa , số điều kiện của ma trận tiền điều kiện sẽ giảm?

1
Bởi vì các lỗi trong dữ liệu sẽ không ảnh hưởng nhiều đến kết quả. Hãy tưởng tượng vị trí của tay trên đồng hồ bằng hai điểm trên mặt đồng hồ. Nếu một điểm rất gần trung tâm và điểm kia nằm trên đường viền, dao động ở vị trí của điểm gần trung tâm sẽ ảnh hưởng đáng kể đến kết quả trong khi điểm trên đường viền ảnh hưởng nhẹ đến vị trí tay. Chuẩn hóa về cơ bản là đặt cả hai điểm trên đường viền làm cho giải pháp ổn định hơn và đặt nó xa hơn từ tâm của mặt đồng hồ (điểm kỳ dị).
Libor

2

Bài viết Wikipedia nêu:

"Điều gì làm cho vấn đề biến đổi tuyến tính trực tiếp trở nên khác biệt..là thực tế là hai bên trái [X] và bên phải [AY] của phương trình xác định [X = AY] có thể khác nhau bởi một yếu tố nhân không xác định phụ thuộc vào k"

Trong X, A, Y trên là ma trận.

Vì vậy, để tránh phải ước tính yếu tố, bạn chỉ cần bình thường hóa tất cả dữ liệu bạn có.


Điều này nghe có vẻ không đúng ... Nếu chúng ta có thể bình thường hóa để làm cho yếu tố không quan trọng, vấn đề có thể được giải quyết bằng phương pháp thông thường là . A=XYT(YYT)1
Michael Litvin

1

Đây là một vấn đề về độ chính xác số. Bằng cách chuẩn hóa tập dữ liệu, bạn căn giữa dữ liệu của mình và cung cấp cho phương sai đơn vị. Những điều kiện này được xử lý tốt hơn bởi người giải quyết sau đó.


Bằng cách xử lý tốt hơn bởi người giải , ý bạn là khi tôi giải quyết loại hệ thống tuyến tính này thông qua SVD , tôi có nên luôn bình thường hóa tập dữ liệu không?

Lưu ý rằng chuẩn hóa ảnh hưởng đến cả tính toán SVD (moe ổn định). Sau đó, bạn sẽ nhận được tỷ lệ nhỏ hơn giữa các giá trị số ít. Cũng lưu ý rằng tập dữ liệu thường nhiễu và tốt hơn là có cùng phương sai cho tất cả các điểm để có được ước tính chính xác hơn.
Libor
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.