Có cách tiếp cận tiêu chuẩn nào để phát hiện sự thay đổi đồng biến giữa dữ liệu huấn luyện và kiểm tra không? Điều này sẽ hữu ích để xác nhận giả định rằng sự thay đổi đồng biến tồn tại trong cơ sở dữ liệu của tôi có chứa vài trăm hình ảnh.
Có cách tiếp cận tiêu chuẩn nào để phát hiện sự thay đổi đồng biến giữa dữ liệu huấn luyện và kiểm tra không? Điều này sẽ hữu ích để xác nhận giả định rằng sự thay đổi đồng biến tồn tại trong cơ sở dữ liệu của tôi có chứa vài trăm hình ảnh.
Câu trả lời:
Có các phương pháp như mô hình phân kỳ Kullback - Leibler , thử nghiệm Wald - Wolfowitz để phát hiện sự không ngẫu nhiên và dịch chuyển hiệp phương sai.
Một thử nghiệm đơn giản để phân tích nhanh kiểm tra hiệp phương sai sẽ là xây dựng mô hình học máy, trong đó mô hình được kiểm tra nhiều lần với việc nhập dữ liệu đào tạo và dữ liệu sản xuất.
Trong trường hợp, mô hình có thể tạo ra sự khác biệt giữa các bộ dữ liệu đào tạo và sản xuất thì nó có thể là một dấu hiệu của sự thay đổi hiệp phương sai.
Học thích ứng với phát hiện thay đổi đồng biến cho giao diện máy tính não dựa trên hình ảnh động cơ http://link.springer.com/article/10.1007/s00500-015-1937-5
Các phương pháp phát hiện thay đổi dựa trên mô hình EWMA để phát hiện các thay đổi đồng biến trong môi trường không cố định ( http://www.scTHERirect.com/science/article/pii/S0031320314002878 )
Đây là một thủ tục đơn giản bạn có thể sử dụng:
Bạn không đưa ra nhiều manh mối về tính chất của hình ảnh mà bạn có thể đang xem xét, nhưng có vẻ như những gì bạn có thể muốn đo là sự khác biệt trong phân phối của các bộ kiểm tra và huấn luyện. Một nơi hữu ích để bắt đầu sẽ là phân kỳ KullbackTHER Leibler, đây là thước đo sự khác biệt của hai bản phân phối.
Vấn đề của sự thay đổi đồng biến cuối cùng dẫn đến các bộ dữ liệu với cấu trúc toán học cơ bản khác nhau. Bây giờ, Manifold Learning ước tính biểu diễn chiều thấp của dữ liệu chiều cao do đó tiết lộ cấu trúc cơ bản. Thông thường các kỹ thuật của Manifold Learning không phải là dự đoán - do đó, khác biệt và mạnh mẽ hơn so với PCA tiêu chuẩn.
Tôi đã sử dụng các kỹ thuật Manifold Learning (ví dụ: IsoMap, MDS, v.v.) để trực quan hóa (và, nếu có thể, định lượng) sự tương tự "(dis)" giữa các tập dữ liệu kiểm tra và kiểm tra.