Tôi đang cố gắng hiểu làm thế nào tôi có thể mô hình hóa tốt nhất một biến trong đó theo thời gian tôi đã thu được các dự đoán ngày càng chi tiết. Ví dụ, hãy xem xét mô hình hóa tỷ lệ thu hồi đối với các khoản vay mặc định. Giả sử chúng ta có một bộ dữ liệu với 20 năm dữ liệu và trong 15 năm đầu tiên chúng ta chỉ biết liệu khoản vay có được thế chấp hay không, nhưng không có gì về đặc điểm của tài sản thế chấp đó. Tuy nhiên, trong năm năm qua, chúng tôi có thể chia tài sản thế chấp thành một loạt các danh mục được dự đoán là một yếu tố dự báo tốt về tỷ lệ thu hồi.
Với thiết lập này, tôi muốn điều chỉnh mô hình phù hợp với dữ liệu, xác định các biện pháp như ý nghĩa thống kê của các yếu tố dự đoán và sau đó dự báo với mô hình.
Những gì thiếu khung dữ liệu này phù hợp với? Có bất kỳ cân nhắc đặc biệt nào liên quan đến thực tế là các biến giải thích chi tiết hơn chỉ có sẵn sau một thời điểm nhất định, trái ngược với việc được phân tán trong mẫu lịch sử?