Nói chung, tôi nghĩ rằng bắt đầu có hiệu quả về mặt khoa học và thống kê hơn bằng cách hỏi một câu hỏi rộng hơn và khác nhau, đó là câu trả lời có thể dự đoán được từ một người dự đoán vòng tròn bao xa. Tôi nói thông tư ở đây chứ không phải định hướng , một phần bởi vì cái sau bao gồm các không gian hình cầu và thậm chí tuyệt vời hơn, tất cả không thể được bao phủ trong một câu trả lời duy nhất; và một phần vì các ví dụ của bạn, thời gian trong ngày và thời gian trong năm , đều là thông tư. Một ví dụ chính nữa là hướng la bàn (liên quan đến gió, động vật hoặc con người, sự sắp xếp, v.v.), đặc trưng trong nhiều vấn đề vòng tròn: thực sự, đối với một số nhà khoa học, đó là điểm khởi đầu rõ ràng hơn.
Bất cứ khi nào bạn có thể thoát khỏi nó, sử dụng các hàm thời gian sin và cos trong một mô hình hồi quy nào đó là một phương pháp mô hình hóa đơn giản và dễ thực hiện. Đây là cảng đầu tiên cho nhiều ví dụ sinh học và / hoặc môi trường. (Hai loại thường được kết hợp với nhau, bởi vì các hiện tượng sinh học thể hiện tính thời vụ thường phản ứng trực tiếp hoặc gián tiếp với khí hậu hoặc thời tiết.)
Để cụ thể, hãy tưởng tượng các phép đo thời gian trong 24 giờ hoặc 12 tháng, ví dụ như vậy
sin[2π(hour/24)], cos[2π(hour/24)]
sin[2π(month/12)], cos[2π(month/12)]
mỗi mô tả một chu kỳ trong toàn bộ ngày hoặc năm. Một thử nghiệm chính thức không có mối quan hệ giữa phản ứng đo hoặc đếm và thời gian tuần hoàn sau đó sẽ là thử nghiệm tiêu chuẩn xem liệu các hệ số của sin và cosin có bằng 0 trong một mô hình tuyến tính tổng quát với sin và cosin như một yếu tố dự đoán, một liên kết và gia đình thích hợp được lựa chọn theo tính chất của phản ứng.
Câu hỏi về phân phối biên của phản ứng (bình thường hay khác) là trong cách tiếp cận thứ cấp này và / hoặc được xử lý theo lựa chọn của gia đình.
Ưu điểm của sin và cosin là tự nhiên là chúng định kỳ và tự động bao quanh, vì vậy các giá trị ở đầu và cuối mỗi ngày hoặc năm nhất thiết phải là một và giống nhau. Không có vấn đề với các điều kiện biên, bởi vì không có ranh giới.
Cách tiếp cận này được gọi là hồi quy tuần hoàn, định kỳ, lượng giác và Fourier. Đối với một đánh giá hướng dẫn giới thiệu, xem ở đây
Trong thực tế,
Các xét nghiệm như vậy thường cho thấy kết quả đáng kể áp đảo ở mức độ thông thường bất cứ khi nào chúng ta mong đợi tính thời vụ. Câu hỏi thú vị hơn là đường cong theo mùa chính xác được ước tính và liệu chúng ta có cần một mô hình phức tạp hơn với các thuật ngữ hình sin khác không.
Không có gì loại trừ các dự đoán khác nữa, trong trường hợp chúng ta chỉ cần các mô hình toàn diện hơn với các dự đoán khác bao gồm, nói các sin và cosin cho tính thời vụ và các dự đoán khác cho mọi thứ khác.
Tại một số điểm, tùy thuộc vào dữ liệu, vấn đề và thị hiếu và kinh nghiệm của nhà nghiên cứu, có thể trở nên tự nhiên hơn để nhấn mạnh khía cạnh chuỗi thời gian của vấn đề và xây dựng mô hình với sự phụ thuộc thời gian rõ ràng. Thật vậy, một số người có đầu óc thống kê sẽ phủ nhận rằng có bất kỳ cách nào khác để tiếp cận nó.
Những gì dễ dàng được đặt tên là xu hướng (nhưng không phải lúc nào cũng dễ nhận biết) nằm trong số 2 hoặc # 3, hoặc thậm chí cả hai.
Nhiều nhà kinh tế và các nhà khoa học xã hội khác quan tâm đến tính thời vụ trong thị trường, nền kinh tế quốc gia và quốc tế hoặc các hiện tượng khác của con người thường ấn tượng hơn với khả năng biến đổi phức tạp hơn trong mỗi ngày hoặc (phổ biến hơn) trong năm. Thông thường, mặc dù không phải lúc nào cũng vậy, tính thời vụ là một mối phiền toái cần được loại bỏ hoặc điều chỉnh, ngược lại với các nhà khoa học sinh học và môi trường, những người thường coi thời vụ là thú vị và quan trọng, thậm chí là trọng tâm chính của dự án. Điều đó nói rằng, các nhà kinh tế và những người khác cũng thường áp dụng cách tiếp cận kiểu hồi quy, nhưng với đạn dược, một bó các biến chỉ báo (giả), đơn giản nhất là biến cho mỗi tháng hoặc mỗi quý một năm0,1. Đây có thể là một cách thực tế để cố gắng nắm bắt các tác động của ngày lễ, thời gian nghỉ phép, tác dụng phụ của năm học, v.v., cũng như ảnh hưởng hoặc cú sốc của nguồn gốc khí hậu hoặc thời tiết. Với những khác biệt được ghi nhận, hầu hết các ý kiến trên cũng áp dụng trong kinh tế và khoa học xã hội.
Thái độ và cách tiếp cận của các nhà dịch tễ học và các nhà thống kê y học liên quan đến sự thay đổi về tỷ lệ mắc bệnh, tỷ lệ tử vong, nhập viện, thăm khám và tương tự, có xu hướng rơi vào giữa hai thái cực này.
Theo quan điểm của tôi, việc chia ngày hoặc năm thành một nửa để so sánh thường là tùy tiện, giả tạo và tốt nhất là khó xử. Nó cũng bỏ qua các loại cấu trúc trơn tru thường có trong dữ liệu.
EDIT Tài khoản cho đến nay không giải quyết được sự khác biệt giữa thời gian rời rạc và liên tục, nhưng tôi không từ kinh nghiệm của mình coi đó là một vấn đề lớn trong thực tế.
Nhưng lựa chọn chính xác phụ thuộc vào cách dữ liệu đến và mô hình thay đổi.
Nếu dữ liệu là hàng quý và con người, tôi sẽ có xu hướng sử dụng các biến chỉ báo (ví dụ: quý 3 và 4 thường khác nhau). Nếu hàng tháng và con người, sự lựa chọn không rõ ràng, nhưng bạn sẽ phải nỗ lực để bán sine và cosin cho hầu hết các nhà kinh tế. Nếu hàng tháng hoặc tốt hơn và sinh học hoặc môi trường, chắc chắn là sin và cosin.
EDIT 2 Chi tiết khác về hồi quy lượng giác
Một chi tiết đặc biệt của hồi quy lượng giác (được đặt tên theo bất kỳ cách nào khác nếu bạn thích) là hầu như luôn luôn các thuật ngữ sin và cos được trình bày tốt nhất cho một mô hình theo cặp. Chúng tôi lần đầu tiên chia tỷ lệ thời gian trong ngày, thời gian trong năm hoặc hướng la bàn để nó được biểu diễn dưới dạng một góc trên vòng tròn
tính bằng radian, do đó trên khoảng . Sau đó, chúng tôi sử dụng nhiều cặp như cần thiết trong một mô hình. (Trong thống kê vòng tròn, các quy ước lượng giác có xu hướng thổi phồng các quy ước thống kê, do đó các ký hiệu Hy Lạp như được sử dụng cho các biến cũng như tham số.)[ 0 , 2 π ] tội lỗi k θ , cos k θ , k = 1 , 2 , 3 , ... θ , φ , ψθ[0,2π]sinkθ,coskθ,k=1,2,3,…θ,ϕ,ψ
Nếu chúng tôi cung cấp một cặp dự đoán như cho một mô hình giống như hồi quy, thì chúng tôi có các ước tính hệ số, giả sử , cho các thuật ngữ trong mô hình, cụ thể là . Đây là một cách của pha phù hợp cũng như biên độ của tín hiệu định kỳ. Mặt khác, một hàm như có thể được viết lại thànhb 1 , b 2 b 1 sin θ , b 2 cos θsinθ,cosθb1,b2b1sinθ,b2cosθsin(θ+ϕ)
sinθcosϕ+cosθsinϕ,
nhưng giai đoạn đại diện cho và được ước tính trong sự phù hợp mô hình. Bằng cách đó chúng ta tránh được một vấn đề ước lượng phi tuyến tính.cosϕsinϕ
Nếu chúng ta sử dụng để mô hình biến thể tròn, thì tự động tối đa và tối thiểu của đường cong đó cách nhau một nửa vòng tròn. Đó thường là một xấp xỉ rất tốt cho các biến đổi sinh học hoặc môi trường, nhưng ngược lại, chúng ta có thể cần thêm một số thuật ngữ để nắm bắt tính thời vụ kinh tế nói riêng. Đó có thể là một lý do rất tốt để sử dụng các biến chỉ báo thay vào đó, điều này ngay lập tức dẫn đến những diễn giải đơn giản về các hệ số.b1sinθ+b2cosθ