Tôi không thể giải thích biểu đồ này. Biến phụ thuộc của tôi là tổng số vé xem phim sẽ được bán cho một chương trình. Các biến độc lập là số ngày còn lại trước khi chương trình, các biến giả theo mùa (ngày trong tuần, tháng trong năm, ngày lễ), giá, vé được bán cho đến ngày, xếp hạng phim, loại phim (phim kinh dị, hài, v.v. ). Ngoài ra, xin lưu ý rằng sức chứa của phòng chiếu phim là cố định. Đó là, nó chỉ có thể lưu trữ tối đa x số người. Tôi đang tạo ra một giải pháp hồi quy tuyến tính và nó không phù hợp với dữ liệu thử nghiệm của tôi. Vì vậy, tôi nghĩ đến việc bắt đầu với chẩn đoán hồi quy. Dữ liệu từ một phòng chiếu phim mà tôi muốn dự đoán nhu cầu.
Đây là một bộ dữ liệu đa biến. Đối với mỗi ngày, có 90 hàng trùng lặp, đại diện cho các ngày trước khi chương trình diễn ra. Vì vậy, cho ngày 1 tháng 1 năm 2016 có 90 hồ sơ. Có một biến 'chì_time' cho tôi số ngày trước khi chương trình diễn ra. Vì vậy, vào ngày 1 tháng 1 năm 2016, nếu chì_time có giá trị 5, điều đó có nghĩa là nó sẽ có vé được bán cho đến 5 ngày trước ngày hiển thị. Trong biến phụ thuộc, tổng số vé được bán, tôi sẽ có cùng giá trị 90 lần.
Ngoài ra, như một nhận xét phụ, có cuốn sách nào giải thích làm thế nào để giải thích cốt truyện còn lại và cải thiện mô hình sau đó không?