Trong bối cảnh khoa học xã hội nơi tôi đến, vấn đề là bạn có quan tâm đến (a) dự đoán hay (b) kiểm tra một câu hỏi nghiên cứu tập trung. Nếu mục đích là dự đoán thì phương pháp tiếp cận dữ liệu là phù hợp. Nếu mục đích là để kiểm tra một câu hỏi nghiên cứu tập trung thì điều quan trọng là phải xem xét mô hình hồi quy nào kiểm tra cụ thể câu hỏi của bạn.
Ví dụ: nếu nhiệm vụ của bạn là chọn một tập hợp các bài kiểm tra lựa chọn để dự đoán hiệu suất công việc, thì mục đích nào đó có thể được xem là một trong những dự đoán tối đa về hiệu suất công việc. Vì vậy, cách tiếp cận theo hướng dữ liệu sẽ hữu ích.
Ngược lại nếu bạn muốn hiểu vai trò tương đối của các biến nhân cách và biến khả năng trong việc ảnh hưởng đến hiệu suất, thì cách tiếp cận so sánh mô hình cụ thể có thể phù hợp hơn.
Thông thường khi khám phá các câu hỏi nghiên cứu tập trung, mục đích là làm sáng tỏ điều gì đó về các quá trình nguyên nhân cơ bản đang hoạt động trái ngược với việc phát triển một mô hình với dự đoán tối ưu.
Khi tôi đang trong quá trình phát triển các mô hình về quy trình dựa trên dữ liệu cắt ngang, tôi sẽ cảnh giác: (a) bao gồm các dự đoán về mặt lý thuyết có thể được coi là hậu quả của biến kết quả. Ví dụ, niềm tin của một người rằng họ là một người biểu diễn tốt là một người dự đoán tốt về hiệu suất công việc, nhưng có khả năng điều này ít nhất một phần là do thực tế là họ đã quan sát hiệu suất của chính họ. (b) bao gồm một số lượng lớn các yếu tố dự đoán đều phản ánh cùng một hiện tượng cơ bản. Ví dụ, bao gồm 20 mặt hàng tất cả đo lường sự hài lòng với cuộc sống theo những cách khác nhau.
Vì vậy, các câu hỏi nghiên cứu tập trung phụ thuộc nhiều vào kiến thức cụ thể của miền. Điều này có lẽ đi một số cách để giải thích tại sao các phương pháp tiếp cận dựa trên dữ liệu thường ít được sử dụng trong khoa học xã hội.