Kết hợp các biến giải thích chi tiết hơn theo thời gian


9

Tôi đang cố gắng hiểu làm thế nào tôi có thể mô hình hóa tốt nhất một biến trong đó theo thời gian tôi đã thu được các dự đoán ngày càng chi tiết. Ví dụ, hãy xem xét mô hình hóa tỷ lệ thu hồi đối với các khoản vay mặc định. Giả sử chúng ta có một bộ dữ liệu với 20 năm dữ liệu và trong 15 năm đầu tiên chúng ta chỉ biết liệu khoản vay có được thế chấp hay không, nhưng không có gì về đặc điểm của tài sản thế chấp đó. Tuy nhiên, trong năm năm qua, chúng tôi có thể chia tài sản thế chấp thành một loạt các danh mục được dự đoán là một yếu tố dự báo tốt về tỷ lệ thu hồi.

Với thiết lập này, tôi muốn điều chỉnh mô hình phù hợp với dữ liệu, xác định các biện pháp như ý nghĩa thống kê của các yếu tố dự đoán và sau đó dự báo với mô hình.

Những gì thiếu khung dữ liệu này phù hợp với? Có bất kỳ cân nhắc đặc biệt nào liên quan đến thực tế là các biến giải thích chi tiết hơn chỉ có sẵn sau một thời điểm nhất định, trái ngược với việc được phân tán trong mẫu lịch sử?

Câu trả lời:


1

OK, từ kinh nghiệm sử dụng dữ liệu lịch sử, lịch sử nhiều hơn có thể làm cho hồi quy phù hợp xuất hiện tốt hơn, nhưng nếu dự đoán là điểm cần thực hiện, câu trả lời chung sẽ được cảnh báo. Trong trường hợp dữ liệu phản ánh các giai đoạn mà "thế giới" rất khác nhau, sự ổn định của các mối tương quan là đáng nghi ngờ. Điều này xảy ra đặc biệt là trong kinh tế nơi thị trường và các quy định không ngừng phát triển.

Điều này giữ cho thị trường bất động sản, ngoài ra, có thể có một chu kỳ dài. Việc phát minh ra các chứng khoán được thế chấp, chẳng hạn, đã thay đổi thị trường thế chấp và mở các cửa xả lũ để bắt đầu thế chấp, và thật không may, đầu cơ (thực sự có cả một nhóm các khoản vay tài liệu không / thấp gọi là các khoản vay lier).

Các phương pháp kiểm tra sự thay đổi chế độ có thể đặc biệt có giá trị trong việc quyết định theo cách không chủ quan khi loại trừ lịch sử.


1

Thông thường, điều này có thể được xem như là một vấn đề giá trị tham số giới hạn. Theo tôi hiểu câu hỏi của bạn, bạn có một thông số ít thông tin hơn (tài sản thế chấp không rõ chất lượng [Cu]) trong dữ liệu của bạn và nhiều thông tin hơn (tài sản thế chấp có chất lượng [Ch], trung bình [Cm] hoặc [Cl] thấp) dữ liệu sau này.

Nếu bạn tin rằng các tham số không quan sát được cho mô hình không thay đổi theo thời gian, thì phương thức có thể đơn giản khi bạn giả sử rằng ước tính điểm của từng mô hình là Cl <Cm <Ch và Cl <= Cu <= Ch. Logic là Cl là tồi tệ nhất và Ch là tốt nhất, vì vậy khi dữ liệu không xác định, nó phải nằm trong khoảng hoặc bằng với dữ liệu đó. Nếu bạn sẵn sàng hạn chế một chút và cho rằng không phải tất cả các tài sản thế chấp đều có chất lượng cao hoặc thấp trong 15 năm đầu tiên, bạn có thể giả sử rằng Cl <Cu <Ch giúp ước tính đơn giản hơn đáng kể.

Ctôi= =điểm kinh nghiệm(β1)Cm= =điểm kinh nghiệm(β1)+điểm kinh nghiệm(β2)Cbạn= =điểm kinh nghiệm(β1)+điểm kinh nghiệm(β3)1+điểm kinh nghiệm(-β4)Ch= =điểm kinh nghiệm(β1)+điểm kinh nghiệm(β2)+điểm kinh nghiệm(β3)

Trong đó hàm logit trong Cu giới hạn giá trị nằm giữa Cl và Ch mà không giới hạn nó so với Cm. (Các chức năng khác giới hạn từ 0 đến 1 cũng có thể được sử dụng.)

Một sự khác biệt khác trong mô hình nên là phương sai nên được cấu trúc sao cho phương sai còn lại phụ thuộc vào khoảng thời gian vì thông tin trong mỗi thời kỳ là khác nhau.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.