Sử dụng các yếu tố dự báo tròn trong hồi quy tuyến tính


19

Tôi đang cố gắng điều chỉnh mô hình sử dụng dữ liệu gió (0, 359) và thời gian trong ngày (0, 23), nhưng tôi lo ngại rằng chúng sẽ không phù hợp với hồi quy tuyến tính vì bản thân chúng không phải là tham số tuyến tính. Tôi muốn chuyển đổi chúng bằng Python. Tôi đã thấy một số đề cập đến việc tính toán một vectơ có nghĩa là bằng cách lấy tội lỗi và cos độ, ít nhất là trong trường hợp gió, nhưng không phải là toàn bộ.

Có thư viện Python hoặc phương pháp liên quan có thể hữu ích không?


1
Cảm ơn bạn đã hỏi điều này như một câu hỏi. Lưu ý rằng việc yêu cầu mã hoặc thư viện là ngoài chủ đề (phần lớn câu hỏi của bạn chắc chắn thuộc chủ đề), do đó khía cạnh đó có thể hoặc không thể được đề cập trong câu trả lời ở đây.
gung - Phục hồi Monica

Biến phản ứng (kết quả, biến phụ thuộc) ở đây là gì? Là hướng gió và thời gian trong ngày cả hai dự báo?
Nick Cox

@NickCox Có, cả hướng gió và thời gian trong ngày đều là dự đoán. Kết quả là một giá trị nguyên biểu thị nồng độ hạt (ô nhiễm không khí). Ngoài ra còn có các dự đoán khác, bao gồm nhiệt độ, độ ẩm, v.v ... nhưng tôi không cần phải chuyển đổi chúng.
compguy24

1
Tôi đã tự do chỉnh sửa tiêu đề. Tiêu đề trước đây "Phân phối tuyến tính độ quanh một vòng tròn" hoàn toàn không nắm bắt được câu hỏi trong quan điểm của tôi.
Nick Cox

Câu trả lời:


23

Hướng gió (ở đây được đo bằng độ, có lẽ là hướng la bàn theo chiều kim đồng hồ từ Bắc) là một biến tròn. Bài kiểm tra là phần đầu thông thường của thang đo giống như phần cuối, tức là . Khi được coi là một yếu tố dự đoán, có lẽ nó được ánh xạ tốt nhất đến sin và cos. Dù phần mềm của bạn là gì, có thể mong đợi các góc được đo bằng radian, vì vậy chuyển đổi sẽ tương đương với0= =360

tội(π phương hướng/180),cos(π phương hướng/180)

cho rằng radian . Tương tự thời gian trong ngày được tính bằng giờ từ nửa đêm có thể được ánh xạ tới sin và cosin bằng cách sử dụng2π= =360

tội(π thời gian/12),cos(π thời gian/12)

hoặc là

tội(π(thời gian+0,5)/12),cos(π(thời gian+0,5)/12)

tùy thuộc vào chính xác thời gian được ghi lại hoặc nên được giải thích.

Đôi khi, tự nhiên hoặc xã hội bắt buộc và sự phụ thuộc vào biến tròn có dạng một số hướng là tối ưu cho phản ứng và hướng ngược lại (cách một nửa vòng tròn) là bi quan. Trong trường hợp đó, một thuật ngữ sin và cos có thể đủ; đối với các mẫu phức tạp hơn, bạn có thể cần các điều khoản khác. Để biết thêm chi tiết, một hướng dẫn về kỹ thuật hồi quy vòng tròn, Fourier, định kỳ, lượng giác này có thể được tìm thấy ở đây , lần lượt tham khảo thêm. Tin tốt là một khi bạn đã tạo ra các thuật ngữ sin và cosin, chúng chỉ là các yếu tố dự đoán bổ sung trong hồi quy của bạn.

Có một tài liệu lớn về thống kê vòng tròn, bản thân nó được coi là một phần của thống kê định hướng. Điều kỳ lạ là kỹ thuật này thường không được đề cập, vì trọng tâm trong đó là tài liệu thường tập trung vào các biến trả lời vòng tròn. Tóm tắt các biến tròn bằng phương tiện vectơ của chúng là một phương pháp mô tả chuẩn nhưng không bắt buộc hoặc trực tiếp hữu ích cho hồi quy.

Một số chi tiết về thuật ngữ Hướng gió và thời gian trong ngày nằm trong các biến thuật ngữ thống kê, không phải là tham số, bất kể cách sử dụng trong ngành khoa học của bạn.

Hồi quy tuyến tính được xác định bởi độ tuyến tính trong các tham số, tức là đối với vectơ dự đoán bởi đó là vectơ của tham số , không phải là ma trận của các yếu tố dự đoán , điều đó quan trọng hơn. Vì vậy, trong trường hợp này, việc các yếu tố dự đoán như sin và cos được đo trên thang tròn và cũng bị giới hạn ở không có rào cản đối với sự xuất hiện của chúng trong hồi quy tuyến tính.yXββX[-1,1]

Nhận xét ngẫu nhiên Đối với một biến phản ứng, chẳng hạn như nồng độ hạt, tôi dự kiến ​​sẽ sử dụng mô hình tuyến tính tổng quát với liên kết logarit để đảm bảo dự đoán tích cực.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.