Các cách để đối phó với đồng biến tròn (ví dụ với GAM) là gì?


8

Tôi đang xây dựng một mô hình trong đó một số đồng biến của tôi sống trên một "vòng tròn", theo nghĩa là chúng lấy các giá trị trong khoảng [0,1) và 0 = 1. Tôi đang tự hỏi về các kỹ thuật để đối phó với tình huống này. Một ý tưởng là biểu diễn một biến tròn theta dưới dạng một cặp biến (sin (theta), cos (theta)). Bất kỳ suy nghĩ về phương pháp này hoặc phương pháp tốt hơn?

Tôi đặc biệt sử dụng GAMs gói mgcv. Có cách nào để nói với mô hình rằng các phần phụ gia nhất định phải có cùng giá trị ở các điểm cuối không? Gói khác?

Cảm ơn!


2
Tôi chỉ từng thấy sin và cosin như bạn đã đề cập, đây là một câu hỏi khác trên trang web có một câu hỏi tương tự, hồi quy logistic với dữ liệu định hướng là IV . Trong câu hỏi này trên SO Iterator có một bình luận chỉ ra một circulargói có thể có thể được quan tâm. Hy vọng rằng bạn nhận được phản hồi tốt hơn mặc dù.
Andy W

2
@Andy sin và cosin không phải là cơ sở duy nhất, thậm chí chúng không phải là cơ sở trực giao duy nhất, cho các hàm định kỳ (tích hợp vuông). Một trong những giá trị của họ là lý thuyết vật lý thường liên quan đến họ trong mối quan hệ với các biến khác. Điều này cho thấy chúng ta nên quan tâm sâu sắc đến mối quan hệ được đưa ra giả thuyết hoặc dự kiến ​​giữa DV và các hiệp phương sai này. DavidR, bạn có thể cho chúng tôi biết gì về điều này?
whuber

Tôi đang cố gắng mô hình hóa một quá trình tạm thời định kỳ. Dữ liệu gốc của tôi là ngày và thời gian của các sự kiện và tôi muốn mô hình hóa tỷ lệ của các sự kiện này theo thời gian. Tôi hy vọng sẽ có tính định kỳ liên quan đến giờ, ngày trong tuần và thời gian trong năm, cho người mới bắt đầu. Đây là các biến tròn rõ ràng. Tôi đang bắt đầu với Poisson-GAM. Tôi quan tâm đến việc kiểm tra các tác động của từng loại một cách riêng biệt, cũng như đưa ra dự đoán tỷ lệ cho thời gian trong tương lai.
DavidR

Câu trả lời:


6

Có hai cách để xử lý các biến tròn, một phương pháp hacky là sao chép thủ công bộ dữ liệu của bạn ở hai bên của các điều kiện biên nhưng giải pháp thanh lịch hơn tôi nghĩ sẽ là sử dụng các hàm cơ sở spline tích hợp với các điều kiện biên định kỳ !

Ví dụ:

bs="cc"chỉ định một spline hồi quy khối tuần hoàn (xem cyclic.cubic.spline). tức là một phép chia hồi quy bậc ba bị phạt có kết thúc khớp, đến đạo hàm thứ hai.

Splines trên quả cầu

bs="sos". Đây là hai spline chiều trên một quả cầu. Các đối số là vĩ độ và kinh độ, và chúng là sự tương tự của các tấm mỏng mỏng cho hình cầu. Hữu ích cho dữ liệu được lấy mẫu trên một phần lớn của địa cầu, khi đẳng hướng là phù hợp. Xem Spherical.Splineđể biết chi tiết.

bs="cp" đưa ra một phiên bản tuần hoàn của P-spline


Nghe có vẻ hoàn hảo! Tôi sẽ thử cái này. Tôi đã nghĩ về phương pháp hacky, nhưng vì tôi có nhiều biến số tròn, tôi đã nghĩ rằng tôi phải tạo ra một số lượng lớn các điểm dữ liệu trùng lặp để hiển thị tất cả các đối xứng khác nhau trong vấn đề.
DavidR

@DavidR Tôi đã thành công tốt đẹp khi sử dụng các khối vuông tròn cho các hiện tượng tần số thấp. Bạn cần đủ để đại diện cho tần số cao nhất bạn muốn mô hình. Điều đó sẽ loại trừ các khoảng thời gian hàng giờ và hàng ngày, nhưng có thể hoạt động tốt cho tính thời vụ. Đối với hai trường hợp trước, phân tích đề xuất bắt đầu với một cơ sở nhỏ như sin và cosin cho mỗi tần số dự kiến.
whuber

@whuber, tôi nghĩ bạn đã hiểu nhầm cách tiếp cận mô hình của DavidR. David đang sử dụng các biến riêng biệt cho giờ, ngày trong tuần, v.v. Vì vậy, anh ta sẽ áp dụng một spline riêng cho mỗi biến. (Sẽ hoan nghênh những suy nghĩ của bạn khi làm điều gì đó tương tự)
seanv507

Whuber, tôi đồng ý với quan điểm của bạn rằng, ví dụ như mô hình hóa việc mua sắm nặng hơn vào tháng 12 sẽ yêu cầu một spline đơn hàng cao trên biến số tháng.
seanv507

0

Bạn có thể muốn xem xét về Gill và Hangartner (2010). Dữ liệu Thông tư trong Khoa học Chính trị và Cách xử lý . Họ nói về các mô hình khác nhau cho dữ liệu vòng tròn / đồng hồ / theo mùa và Jeff Gill cung cấp mã R cho bài báo mà bạn có thể xem xét để lấy cảm hứng. Cần có một phiên bản trình bày của tài liệu này để kết hợp phương pháp và mã R lại với nhau.


Cảm ơn con trỏ này vào tài liệu về dữ liệu tròn. Có vẻ như một điểm khởi đầu tốt. Tôi nhanh chóng lướt qua bài viết đặc biệt này, và nó dường như để đối phó với các phản hồi vòng tròn, thay vì các đồng biến tròn.
DavidR
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.