TLDR:
Tập dữ liệu của tôi là khá nhỏ (120) mẫu. Trong khi thực hiện xác nhận chéo 10 lần, tôi nên:
Thu thập các kết quả đầu ra từ mỗi lần kiểm tra, ghép chúng thành một vectơ và sau đó tính toán sai số trên vectơ đầy đủ của dự đoán này (120 mẫu)?
Hoặc thay vào đó tôi nên tính toán sai số trên các đầu ra tôi nhận được trên mỗi lần gấp (với 12 mẫu trên mỗi lần), và sau đó lấy ước tính lỗi cuối cùng của tôi là trung bình của ước tính lỗi 10 lần?
Có bài báo khoa học nào tranh luận về sự khác biệt giữa các kỹ thuật này không?
Bối cảnh: Mối quan hệ tiềm năng với điểm số Macro / Micro trong phân loại đa nhãn:
Tôi nghĩ rằng câu hỏi này có thể liên quan đến sự khác biệt giữa trung bình vi mô và vĩ mô thường được sử dụng trong tác vụ phân loại nhiều nhãn (ví dụ: 5 nhãn).
Trong cài đặt đa nhãn, điểm trung bình vi mô được tính bằng cách lập bảng dự phòng tổng hợp gồm dương thực, dương dương tính, âm tính thật, âm tính giả cho cả 5 dự đoán phân loại trên 120 mẫu. Bảng dự phòng này sau đó được sử dụng để tính toán độ chính xác vi mô, thu hồi vi mô và vi đo f. Vì vậy, khi chúng tôi có 120 mẫu và năm phân loại, các biện pháp vi mô được tính toán trên 600 dự đoán (120 mẫu * 5 nhãn).
Khi sử dụng biến thể Macro , người ta sẽ tính toán các biện pháp (độ chính xác, thu hồi, v.v.) một cách độc lập trên mỗi nhãn và cuối cùng, các biện pháp này được tính trung bình.
Ý tưởng đằng sau sự khác biệt giữa các ước tính vi mô và vĩ mô có thể được mở rộng thành những gì có thể được thực hiện trong cài đặt K-Fold trong một vấn đề phân loại nhị phân. Trong 10 lần, chúng ta có thể lấy trung bình trên 10 giá trị (số đo Macro ) hoặc nối 10 thí nghiệm và tính toán các biện pháp vi mô .
Bối cảnh - Ví dụ mở rộng:
Ví dụ sau minh họa cho câu hỏi. Giả sử chúng ta có 12 mẫu thử nghiệm và chúng ta có 10 lần:
- Gấp 1 : TP = 4, FP = 0, TN = 8 Chính xác = 1.0
- Gấp 2 : TP = 4, FP = 0, TN = 8 Chính xác = 1.0
- Gấp 3 : TP = 4, FP = 0, TN = 8 chính xác = 1,0
- Gấp 4 : TP = 0, FP = 12, Chính xác = 0
- Gấp 5 .. Gấp 10 : Tất cả đều có cùng TP = 0, FP = 12 và Chính xác = 0
nơi tôi đã sử dụng ký hiệu sau:
TP = # của tích cực thực, FP = # sai tích cực, TN = # của âm tính thực
Kết quả là:
- Độ chính xác trung bình trên 10 lần = 3/10 = 0,3
- Độ chính xác về kết hợp các dự đoán của 10 lần = TP / TP + FP = 12/12 + 84 = 0.125
Lưu ý rằng các giá trị 0,3 và 0,125 rất khác nhau !