Điều này nhắc nhở tôi về chẩn đoán ung thư, trong đó chữ ký biểu hiện gen cũ được thay thế bằng những cái mới hơn, tất nhiên được cho là tốt hơn. Nhưng làm thế nào để chứng tỏ rằng họ tốt hơn?
Dưới đây là một vài gợi ý để so sánh độ lặp lại của các phương thức.
1. Sử dụng phân tích quán tính đồng (CIA).
CIA nên được quảng cáo nhiều hơn, thật không may, nó không được sử dụng rộng rãi (ví dụ không có trang Wikipedia). CIA là một phương pháp hai bảng hoạt động theo cùng một nguyên tắc như phân tích chính tắc (CA), nhằm tìm kiếm một cặp điểm số tuyến tính với mối tương quan tối đa giữa hai bộ phép đo đa chiều. Ưu điểm của nó so với CA là bạn có thể làm điều đó ngay cả khi bạn có nhiều kích thước hơn các quan sát. Bạn có thể đo cả hai phương thức trên cùng một mẫu để có được hai bảng được ghép gồm 30 cột vànquan sát. Cặp thành phần chính đầu tiên cần được tương quan mạnh (nếu các phương thức thực sự đo lường cùng một thứ). Nếu phương pháp B tốt hơn, phương sai dư phải nhỏ hơn phương sai dư của phương pháp A. Với phương pháp này, bạn giải quyết cả thỏa thuận của phương pháp và sự bất đồng của chúng, mà bạn hiểu là nhiễu.
2. Sử dụng một khoảng cách .
Bạn có thể sử dụng khoảng cách Euclide trong 30 chiều giữa thử nghiệm và kiểm tra lại để đo độ lặp lại của phương pháp. Bạn tạo một mẫu điểm số đó cho từng phương pháp và bạn có thể so sánh các mẫu với thử nghiệm Wilcoxon.
3. Sử dụng ứng dụng xuôi dòng.
Bạn có thể nhận được những dấu vân tay này để đưa ra quyết định, hoặc phân loại bệnh nhân hoặc vật liệu sinh học. Bạn có thể đếm các thỏa thuận và bất đồng giữa các thử nghiệm và thử nghiệm lại cho cả hai phương pháp và so sánh chúng với thử nghiệm Wilcoxon.
Phương pháp 3 là đơn giản nhất, nhưng cũng dễ nhất. Ngay cả đối với đầu vào chiều cao, các quyết định thường khá đơn giản. Và tuy nhiên vấn đề phức tạp của chúng tôi là, hãy nhớ rằng thống kê là khoa học của quyết định.
Về câu hỏi trong bình luận của bạn.
Điều gì về việc sử dụng một phương pháp giảm kích thước mạnh mẽ để giảm dữ liệu đa biến thành một chiều duy nhất và phân tích nó?
Tuy nhiên, việc giảm kích thước sẽ mạnh mẽ, có liên quan đến việc mất phương sai. Nếu có một cách để biến dấu vân tay đa biến của bạn thành một điểm số duy nhất nắm bắt gần như toàn bộ phương sai của nó, thì chắc chắn, đây là điều tốt nhất để làm. Nhưng tại sao đầu tiên là dấu vân tay đa biến?
Tôi giả định từ bối cảnh của OP rằng dấu vân tay là đa biến chính xác bởi vì khó có thể giảm kích thước của nó hơn nữa mà không mất thông tin. Trong trường hợp đó, độ lặp lại của chúng trên một điểm duy nhất không phải là một proxy tốt cho độ lặp lại tổng thể, bởi vì bạn có thể bỏ qua phần lớn phương sai (gần 29/30 trong trường hợp xấu nhất).