Tôi đang làm bài tập về nhà, nơi giáo sư của tôi muốn chúng tôi tạo ra một mô hình hồi quy thực, mô phỏng một mẫu dữ liệu và anh ấy sẽ cố gắng tìm mô hình hồi quy thực sự của chúng tôi bằng cách sử dụng một số kỹ thuật chúng tôi đã học trong lớp. Chúng tôi cũng sẽ phải làm như vậy với một bộ dữ liệu anh ấy đưa cho chúng tôi.
Anh ấy nói rằng anh ấy đã có thể tạo ra một mô hình khá chính xác cho tất cả những nỗ lực trong quá khứ để thử và lừa anh ấy. Đã có một số sinh viên tạo ra một số mô hình điên rồ nhưng anh ta cho rằng có thể tạo ra một mô hình đơn giản hơn, vừa đủ.
Làm thế nào tôi có thể đi về việc phát triển một mô hình khó khăn cho anh ta để tìm? Tôi không muốn trở nên siêu rẻ bằng cách thực hiện 4 thuật ngữ bậc hai, 3 quan sát và phương sai lớn? Làm thế nào tôi có thể tạo ra một bộ dữ liệu dường như vô hại có một mô hình nhỏ khó khăn bên dưới nó?
Anh ta chỉ cần có 3 Quy tắc để tuân theo:
Tập dữ liệu của bạn phải có một biến "Y" và 20 biến "X" được gắn nhãn là "Y", "X1", ..., "X20".
Biến phản hồi của bạn phải đến từ mô hình hồi quy tuyến tính thỏa mãn: trong đó và .Y ' i = β 0 + β 1 X ' i 1 + ... + β p - 1 X ' i , p - 1 + ε i ε i ~ N ( 0 , σ 2 ) p ≤ 21
Tất cả các biến được sử dụng để tạo đều có trong tập dữ liệu của bạn.Y
Cần lưu ý, không phải tất cả 20 biến X cần có trong mô hình thực của bạn
Tôi đã nghĩ đến việc sử dụng một cái gì đó giống như Mô hình 3 yếu tố Fama-French và để anh ấy bắt đầu với dữ liệu chứng khoán (SPX và AAPL) và phải chuyển đổi các biến đó thành lợi nhuận gộp liên tục để quan sát thêm một chút. Nhưng điều đó để lại cho tôi những giá trị còn thiếu trong lần quan sát đầu tiên và đó là chuỗi thời gian (mà chúng ta chưa thảo luận trong lớp).
Không chắc chắn nếu đây là nơi thích hợp để đăng một cái gì đó như thế này. Tôi cảm thấy như nó có thể tạo ra một số cuộc thảo luận tốt.
Chỉnh sửa: Tôi cũng không yêu cầu các mô hình "dựng sẵn" nói riêng. Tôi tò mò hơn về các chủ đề / công cụ trong Thống kê sẽ cho phép ai đó thực hiện điều này.