Đối với tôi, dường như câu hỏi của bạn thường đề cập đến hương vị xác nhận khác nhau cho mô hình dự đoán: Xác thực chéo có phần liên quan nhiều hơn đến tính hợp lệ bên trong , hoặc ít nhất là giai đoạn mô hình hóa ban đầu, trong khi vẽ liên kết nhân quả trên dân số rộng hơn có liên quan nhiều hơn đến tính hợp lệ bên ngoài. Bằng cách đó (và như một bản cập nhật theo nhận xét tốt đẹp của @ Brett), ý tôi là chúng ta thường xây dựng một mô hình trên một mẫu làm việc, giả sử một mô hình khái niệm giả định (nghĩa là chúng ta chỉ định mối quan hệ giữa các yếu tố dự đoán và kết quả quan tâm), và chúng tôi cố gắng để có được ước tính đáng tin cậy với tỷ lệ lỗi phân loại tối thiểu hoặc lỗi dự đoán tối thiểu. Hy vọng rằng, mô hình hoạt động tốt hơn, nó sẽ cho phép chúng ta dự đoán kết quả trên dữ liệu không nhìn thấy tốt hơn; Tuy nhiên, CV không cho biết bất cứ điều gì về "tính hợp lệ" hoặc tính thỏa đáng của các liên kết nhân quả được đưa ra giả thuyết. Chúng tôi chắc chắn có thể đạt được kết quả tốt với một mô hình trong đó một số hiệu ứng kiểm duyệt và / hoặc hòa giải bị bỏ qua hoặc đơn giản là không biết trước.
Quan điểm của tôi là dù phương pháp bạn sử dụng để xác nhận mô hình của bạn là gì (và phương pháp nắm giữ chắc chắn không phải là phương pháp tốt nhất, nhưng nó vẫn được sử dụng rộng rãi trong nghiên cứu dịch tễ học để giảm bớt các vấn đề phát sinh từ việc xây dựng mô hình từng bước), bạn làm việc với cùng một mẫu (mà chúng tôi giả sử là đại diện của một dân số lớn hơn). Ngược lại, việc khái quát hóa các kết quả và các liên kết nhân quả đã suy ra theo cách này với các mẫu mới hoặc một quần thể có liên quan hợp lý thường được thực hiện bằng các nghiên cứu sao chép . Điều này đảm bảo rằng chúng tôi có thể kiểm tra một cách an toàn khả năng dự đoán của mô hình của chúng tôi trong "siêu phổ biến" có phạm vi biến thể riêng lẻ lớn hơn và có thể thể hiện các yếu tố tiềm năng khác.
Mô hình của bạn có thể cung cấp các dự đoán hợp lệ cho mẫu làm việc của bạn và nó bao gồm tất cả các yếu tố gây nhiễu tiềm năng mà bạn có thể nghĩ đến; tuy nhiên, có thể nó sẽ không hoạt động tốt với dữ liệu mới, chỉ vì các yếu tố khác xuất hiện trong đường dẫn nhân quả can thiệp không được xác định khi xây dựng mô hình ban đầu. Điều này có thể xảy ra nếu một số dự đoán và các liên kết nhân quả được suy ra từ đó phụ thuộc vào trung tâm thử nghiệm cụ thể nơi bệnh nhân được tuyển dụng, ví dụ.
Trong dịch tễ học di truyền, nhiều nghiên cứu kết hợp trên toàn bộ gen không thể sao chép chỉ vì chúng tôi đang cố gắng mô hình hóa các bệnh phức tạp với quan điểm đơn giản về mối quan hệ nhân quả giữa các dấu ấn DNA và kiểu hình quan sát được, trong khi rất có khả năng gen-gen (epistark), bệnh gen (pleiotropy), môi trường gen và cấu trúc dân số đều phát huy tác dụng, nhưng hãy xem ví dụ Xác thực, tăng cường và tinh chỉnh các tín hiệu liên kết trên toàn bộ gen(Ioannidis và cộng sự, Bản chất di truyền học, 2009 10). Vì vậy, chúng ta có thể xây dựng một mô hình biểu diễn để giải thích các biến đổi chéo quan sát được giữa một tập hợp các dấu hiệu di truyền (với kích thước hiệu ứng rất thấp và thưa thớt) và một kiểu hình đa biến của các kiểu hình quan sát (ví dụ: thể tích của chất trắng / xám hoặc các hoạt động cục bộ trong não như được quan sát thông qua fMRI, phản ứng với đánh giá về tâm thần kinh hoặc kiểm kê tính cách), nhưng nó vẫn không thực hiện như mong đợi trên một mẫu độc lập.
Đối với một tài liệu tham khảo chung về chủ đề này, có thể đề xuất chương 17 và Phần III của các mô hình dự đoán lâm sàng , từ EW Steyerberg (Springer, 2009). Tôi cũng thích bài viết sau từ Ioannidis:
Ioannidis, JPA, Tại sao hầu hết các kết quả nghiên cứu được công bố là sai? PLoS Med. 2005 2 (8): e124