Những vấn đề nào tôi nên đề phòng khi kết hợp nhiều chuỗi thời gian?


10

Giả sử tôi có một số chuỗi thời gian, ví dụ như một số bản ghi nhiệt độ từ các trạm khác nhau trong một khu vực. Tôi muốn có được một bản ghi nhiệt độ duy nhất cho toàn bộ khu vực mà tôi có thể mô tả các khía cạnh của khí hậu khu vực. Cách tiếp cận trực quan có thể chỉ đơn giản là lấy trung bình của tất cả các trạm tại mỗi dấu thời gian, nhưng cảm giác nhện thống kê của tôi (mà tôi chắc chắn chưa liên lạc tốt) cho tôi biết rằng điều này có thể không dễ dàng như vậy. Cụ thể, tôi tưởng tượng rằng việc tính trung bình trên toàn bộ khu vực sẽ loại bỏ một số cực trị nhiệt độ thú vị và tôi có thể gặp vấn đề với sự phụ thuộc giữa các trạm gần.

Những vấn đề nào khác tôi có thể gặp phải nếu tôi thử một chiến lược như thế này, và có cách nào để khắc phục chúng, hoặc các phương pháp hợp lý hơn để kết hợp loại dữ liệu này?

Lưu ý: Câu trả lời có thể tổng quát hơn ví dụ không gian tôi đã cung cấp.


1
Vấn đề có thể là do xung đột giữa "một bản ghi nhiệt độ duy nhất cho toàn khu vực" và bất kỳ mối quan tâm nào của bạn đối với sự thay đổi trong khu vực. Một giải pháp có thể liên quan đến một số cách dung hòa hai vấn đề này, ví dụ như phân vùng phương sai thành các thành phần trong và liên khu vực.
Peter Ellis

@PeterEllis, yeah, tôi đã mơ hồ nghĩ về điều đó. Đối với mục đích của câu hỏi, giả sử tôi không quan tâm đến sự biến đổi không gian bên trong.
ness101

trong trường hợp đó, tôi nghĩ điều chính bạn phải lo lắng là sự phụ thuộc giữa các trạm gần. Tìm cách giảm trọng lượng các quan sát nhân đôi hiệu quả của trạm bên cạnh, và bạn sẽ ổn thôi.
Peter Ellis

@PeterEllis: ok, nhưng có thể không có cách vật lý hợp lý để làm điều đó - Sự gần gũi của các trạm không nhất thiết có nghĩa là chúng phụ thuộc nhiều hơn - tức là. hai trạm đóng ở phía đối diện của một dãy núi có thể ít giống nhau hơn hai trạm xa trên một đồng bằng rộng. Có một cách đáng tin cậy để xác định sự phụ thuộc thống kê? Hiệp phương sai, tôi cho rằng ... Vẫn có khả năng sẽ có ít đỉnh hơn trong chuỗi kết quả (tôi đoán điều đó phản ánh tình hình vật lý - thay đổi tạm thời trên một khu vực rộng có thể chậm hơn và ổn định hơn ở một nơi duy nhất).
ness101

@naught, liên quan đến khía cạnh không gian của câu hỏi của bạn, các khu vực của bạn được xác định như thế nào? Trong bình luận của bạn, bạn đề cập rằng hai trạm đóng ở hai phía đối diện của một ngọn núi có thể khác với hai trạm xa trên một đồng bằng rộng. Bạn đã xem xét việc xác định lại các khu vực trạm dựa trên sự gần gũi và tương tự cho phân tích của bạn chưa? Họ sẽ không nhất thiết phải phù hợp với ranh giới khu vực thông thường. Thay vào đó, chúng có thể trở thành lớp phủ phân tích có thể được vẽ trên bản đồ truyền thống.
dav

Câu trả lời:


1

Đầu tiên, tôi muốn nói rằng tôi sẽ thêm một bình luận, nhưng tôi chưa thể làm điều đó (đại diện), nhưng tôi thích câu hỏi và muốn tham gia, vì vậy đây là "câu trả lời". Ngoài ra, tôi thấy rằng điều này là cũ, nhưng nó thú vị.

Đầu tiên, liệu có thể sử dụng một kỹ thuật giảm kích thước, như PCA, để cô đọng chuỗi thời gian không? Nếu giá trị riêng đầu tiên lớn, có thể điều đó có nghĩa là việc bạn sử dụng hàm riêng sẽ đại diện cho hầu hết các động lực.

Thứ hai, và tổng quát hơn, bạn muốn sử dụng chuỗi thời gian nào? Không biết nhiều, tôi đoán rằng nhiệt độ có thể thay đổi khá nhiều. Ví dụ, nếu một số bản ghi nhiệt độ ở gần các thành phố, bạn có thể có được hiệu ứng loại "đảo nhiệt". Hoặc có lẽ một thay đổi nhỏ về khoảng cách bên xảy ra tạo ra sự thay đổi lớn về khoảng cách dọc --- một vị trí có thể ở mực nước biển và ngay trên đại dương, và một vị trí khác không "quá xa", nhưng ở độ cao một km. Những người chắc chắn sẽ có nhiệt độ khác nhau!

Đây chỉ là một số suy nghĩ. Có lẽ ai đó khác có thể nhảy vào và đưa ra một câu trả lời tốt hơn.


1
Điểm tốt. Thành thật mà nói, tôi không thể nhớ bối cảnh xung quanh câu hỏi này là gì và tôi có cảm giác rằng những bình luận của tôi đã gây hiểu nhầm. Tôi đặc biệt quan tâm đến việc không mất đi sự thay đổi chung cho tất cả các trạm, nhưng ngoài giai đoạn. Hãy nghĩ về các trạm trên khắp một lục địa, và một mặt trận lạnh lẽo đi qua. Một trung bình không gian đơn giản về cơ bản có thể loại bỏ mặt lạnh, điều này không thực sự tốt, vì mỗi trạm sẽ thể hiện nó một cách mạnh mẽ, nhưng vào những thời điểm khác nhau. Có thể chạy một số loại PCA trên mỗi trạm và sau đó lấy trung bình các kết quả bằng cách nào đó có thể là một cách để khắc phục điều đó.
nè 101

Ôi, ok, vì vậy nếu bạn đang cố gắng mô tả xu hướng trong chuỗi thời gian trên khu vực, có lẽ bạn nên đặt chuỗi thời gian đứng yên và mỗi chuỗi có giá trị bằng 0. Bạn cũng có thể cố gắng loại bỏ chu kỳ hàng ngày khỏi mỗi người (hoặc chỉ lấy trung bình hàng ngày). Sau đó, bạn sẽ bị thay đổi tần số thấp hơn về nhiệt độ, mỗi trung tâm xung quanh giá trị trung bình là 0. Một khi bạn đã có điều đó, thì có lẽ bạn có thể ngưng tụ chuỗi thời gian trung tâm + tĩnh bằng cách sử dụng một số kỹ thuật giảm kích thước, chẳng hạn như PCA. Tôi rất vui vì bạn đã nói về bối cảnh của câu hỏi một chút, b / c thực sự có ích. Đồ tốt!
rbatt
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.