Có ít nhất hai khả năng cho dữ liệu này. Một khả năng là microarrays của bạn không chứa bất kỳ dấu hiệu bệnh nào. Tuy nhiên, chúng có chứa thông tin về tuổi tác và vì trong trường hợp của bạn, dân số mắc bệnh và đối chứng ở độ tuổi khác nhau, bạn sẽ ảo tưởng về hiệu suất phân loại tốt. Một khả năng khác là các microarrays có chứa các dấu hiệu bệnh và hơn nữa, các dấu hiệu này chính xác là những gì SVM tập trung vào.
Có vẻ như các thành phần chính của dữ liệu có thể tương quan với tuổi trong cả hai khả năng này. Trong trường hợp đầu tiên, đó sẽ là vì tuổi tác là những gì dữ liệu thể hiện. Trong trường hợp thứ hai, đó là vì bệnh là những gì dữ liệu thể hiện và chính căn bệnh này có liên quan đến tuổi tác (đối với tập dữ liệu của bạn). Tôi không nghĩ có một cách dễ dàng để xem xét giá trị tương quan và kết luận đó là trường hợp nào.
Tôi có thể nghĩ ra một số cách để đánh giá hiệu quả khác nhau. Một lựa chọn là chia tập huấn luyện của bạn thành các nhóm có độ tuổi bằng nhau. Trong trường hợp này, đối với lứa tuổi 'trẻ', lớp bình thường sẽ có nhiều ví dụ đào tạo hơn lớp bệnh và ngược lại đối với lứa tuổi lớn hơn. Nhưng miễn là có đủ ví dụ, đây không phải là vấn đề. Một lựa chọn khác là làm tương tự với các bộ kiểm tra, tức là xem liệu bộ phân loại có xu hướng nói 'bệnh' thường xuyên hơn cho bệnh nhân lớn tuổi hay không. Cả hai tùy chọn này có thể khó khăn vì bạn không có nhiều ví dụ.
Một lựa chọn nữa là đào tạo hai phân loại. Đầu tiên, tính năng duy nhất sẽ là tuổi. Có vẻ như điều này có AUC là 0,82. Trong lần thứ hai, sẽ có tuổi và dữ liệu microarray. (Có vẻ như hiện tại bạn đang đào tạo một trình phân loại khác chỉ sử dụng dữ liệu microarray và nó cung cấp cho bạn AUC 0.95. Thêm tính năng tuổi rõ ràng có khả năng cải thiện hiệu suất, vì vậy AUC sẽ còn cao hơn.) Thứ nhất, điều này cho thấy tuổi tác không phải là điều duy nhất quan tâm trong dữ liệu này. Dựa trên nhận xét của bạn, sự cải thiện trong AUC là 0,13 trở lên, có vẻ công bằng.