Chuỗi thời gian cao bất thường


10

Tôi có dữ liệu về quần thể của một số loài cá khác nhau, được lấy mẫu trong khoảng thời gian khoảng 5 năm, nhưng trong một mô hình rất bất thường. Đôi khi có những tháng giữa các mẫu, đôi khi có một vài mẫu trong một tháng. Ngoài ra còn có nhiều số 0

Làm thế nào để đối phó với dữ liệu đó?

Tôi có thể vẽ đồ thị đủ dễ dàng trong R, nhưng các biểu đồ không đặc biệt chiếu sáng, vì chúng rất gập ghềnh.

Về mặt mô hình hóa - với các loài được mô hình hóa như một chức năng của nhiều thứ khác nhau - có thể là một mô hình hỗn hợp (còn gọi là mô hình đa cấp).

Mọi tham khảo hay ý tưởng đều được chào đón

Một số chi tiết phản hồi ý kiến

Có khoảng 15 loài.

Tôi đang cố gắng để có được một ý tưởng về bất kỳ xu hướng hoặc tính thời vụ nào trong mỗi con cá và xem xét các loài có liên quan với nhau như thế nào (ban đầu khách hàng của tôi muốn có một bảng tương quan đơn giản)

Mục tiêu là mô tả và phân tích, không dự đoán

Chỉnh sửa thêm: Tôi đã tìm thấy bài báo này của K. Rehfield và cộng sự, trong đó gợi ý sử dụng hạt nhân Gaussian để ước tính ACF cho chuỗi thời gian rất bất thường

http://www.nonlin- Processes-geophys.net/18/389/2011/npg-18-389-2011.pdf


1
Tôi không phải là người thích hợp để trả lời câu hỏi của bạn, nhưng một mô hình đa cấp nghe có vẻ hợp lý. Bất kỳ gợi ý nào về các mẫu lớn như thế nào, có bao nhiêu loài và số lượng không xuất hiện như thế nào? (Trên điểm cuối cùng, là những nỗ lực mẫu tại mẫu ngẫu nhiên, hoặc là họ thiên vị, giống như bạn chỉ nhận được đếm từ một cuộc thi âm bass-cá mà có thể sẽ không mang lại bất kỳ cá da trơn?)
Wayne

1
"Đối phó" nghĩa là gì? Đối với một số ý tưởng về việc đối phó với thời gian bất thường, hãy tìm kiếm trang web này trên "+ không thường xuyên + thời gian"
whuber

Bạn có thể làm rõ việc lấy mẫu và mục tiêu? Ví dụ, việc bắt lại này? Đây có phải là một mạng được đặt trong một luồng trong một khoảng thời gian cụ thể, mà không phát hành? Bạn đang cố gắng ước tính kích thước mẫu trong tương lai hoặc dân số lớn hơn mà từ đó một mẫu được rút ra? Là các mẫu từ 1 hoặc nhiều địa điểm? Không có gì sai với chuỗi thời gian không đều, nhưng hơi khó hiểu về mối liên hệ giữa các sự kiện lấy mẫu và giữa các mẫu với một số biến mục tiêu (ví dụ: phản hồi mô hình). Ngoài ra, là mục tiêu dự đoán hoặc mô tả trong tự nhiên?
vòng lặp

2
Tại sao ai đó bỏ phiếu câu hỏi này? Tại sao không cố gắng giúp phát triển một câu hỏi hoặc câu trả lời tốt hơn?
Lặp lại

2
@Iterator Bởi vì ngay cả bây giờ, sau khi "chỉnh sửa thêm", không có câu hỏi rõ ràng ở đây. Downvote (được gửi sau khi không có phản hồi nào được đưa ra cho nhận xét đầu tiên của tôi) đã được đặt để khuyến khích OP cung cấp các cải tiến cần thiết, cũng như tín hiệu về trạng thái duy nhất được hình thành một phần của câu hỏi khi nó đứng. Đó không phải là công việc của mọi người đọc (cũng không phải mod, đối với vấn đề đó) để đoán những gì dự định!
whuber

Câu trả lời:


10

Tôi đã dành khá nhiều thời gian để xây dựng một khung chung cho chuỗi thời gian không đều nhau: http://www.eckner.com/research.html

Ngoài ra, tôi đã viết một bài báo về ước tính xu hướng và thời vụ cho chuỗi thời gian không đều nhau.

Tôi hy vọng bạn sẽ tìm thấy kết quả hữu ích!


5
Cảm ơn! Phân tích đó đã có từ lâu và tôi không còn thực hiện nó nữa, nhưng những điều tương tự có thể xuất hiện trở lại; và những người khác tìm kiếm các chủ đề này rất nhiều, vì vậy bình luận của bạn không bị lãng phí.
Peter Flom - Tái lập Monica

Cảm ơn thông tin (và thực sự nhiều năm sau đó, một người nào đó trên internet đang tìm kiếm nó!), Nhưng liên kết đã chết.
Móc vào

2

Tôi không biết liệu một mô hình hỗn hợp có phù hợp hay không (sử dụng các gói tiêu chuẩn trong đó cấu trúc hiệu ứng ngẫu nhiên là một công cụ dự báo tuyến tính), trừ khi bạn nghĩ rằng dữ liệu tại mọi thời điểm nên được trao đổi với nhau theo một nghĩa nào đó (trong trường hợp nào đó các khoảng không đều là một vấn đề) - nó thực sự sẽ không mô hình hóa sự tự tương quan thời gian một cách hợp lý. Có thể bạn có thể lừa lmer () thực hiện một số việc tự động nhưng chính xác là bạn sẽ làm thế nào để thoát khỏi tôi ngay bây giờ (tôi có thể không nghĩ thẳng). Ngoài ra, tôi không chắc chắn "biến nhóm" sẽ gây ra hiện tượng tự tương quan trong kịch bản mô hình hỗn hợp.

Nếu tự động tương quan thời gian là một tham số phiền toái và bạn không mong đợi nó cũng vậylớn, sau đó bạn có thể chia dữ liệu thành các kỷ nguyên về cơ bản tách rời nhau về mặt tương quan (ví dụ: tách chuỗi thời gian tại các điểm không có dữ liệu) và xem chúng là các bản sao độc lập. Sau đó, bạn có thể thực hiện một cái gì đó giống như một GEE trên tập dữ liệu đã sửa đổi này trong đó "cụm" được xác định theo thời gian bạn đang ở và các mục của ma trận tương quan làm việc là một chức năng của các quan sát được thực hiện cách nhau bao xa. Nếu hàm hồi quy của bạn là chính xác, thì bạn vẫn sẽ nhận được các ước tính nhất quán về các hệ số hồi quy, ngay cả khi cấu trúc tương quan bị sai. Điều này cũng sẽ cho phép bạn mô hình hóa nó dưới dạng dữ liệu đếm bằng cách sử dụng, ví dụ, liên kết nhật ký (như thường thấy trong hồi quy poisson). Bạn cũng có thể xây dựng trong một số mối tương quan khác biệt giữa các loài, trong đó mỗi điểm thời gian được xem như một vectơ đa biến của các loài được tính với một số liên kết phân rã theo thời gian giữa các điểm thời gian. Điều này sẽ yêu cầu một số tiền xử lý để lừa các gói GEE tiêu chuẩn thực hiện việc này.

Nếu tự động tương quan thời gian không phải là một tham số phiền toái, tôi sẽ thử một cái gì đó giống như một mô hình hiệp phương sai có cấu trúc trong đó bạn xem toàn bộ dữ liệu như một quan sát của một vectơ đa biến lớn sao cho hiệp phương sai giữa các quan sát trên các loài làYs,Ytu,v

cov(Ys,Yt)=fθ(s,t,u,v)

Trong đó là một số hàm tham số được biết đến với số lượng tham số hữu hạn, , cùng với một số tham số để chi phối cấu trúc trung bình. Bạn có thể cần phải "tự xây dựng" cho một mô hình như thế này, nhưng tôi cũng không ngạc nhiên nếu có các gói MPLUS để thực hiện những việc như thế này để đếm dữ liệu.fθ


Cảm ơn @macro. Tôi nghĩ rằng một mô hình hỗn hợp có thể ổn vì chúng thường được sử dụng cho dữ liệu được lồng trong thời gian; Tôi không quan tâm lắm đến việc mô hình hóa sự tự tương quan - đó là một sự phiền toái. Tôi đồng ý thời gian sẽ không tuyến tính, nhưng tôi có thể thêm hiệu ứng của thời gian (chưa chắc là cái nào, nhưng tôi có thể khám phá nó). Tôi không có MPLUS, nhưng tôi có R và SAS.
Peter Flom - Tái lập Monica

1
Tôi chỉ nói rằng một mô hình hỗn hợp tiêu chuẩn có thể không phù hợp trong tình huống này. Chặn ngẫu nhiên là vô ích nếu bạn không nghĩ rằng thời điểm có thể trao đổi về mặt tương quan (nghĩa là nó chỉ cung cấp một xấp xỉ trong thế giới 'tương quan có thể trao đổi' với cấu trúc tương quan thực sự của bạn). Bao gồm các sườn dốc ngẫu nhiên theo thời gian cho thấy bạn nghĩ rằng quỹ đạo đang "đi đâu đó" theo thời gian - vì cốt truyện không được chiếu sáng cho bạn, điều này có lẽ không xảy ra. Tôi sẽ thừa nhận, mặc dù bạn có thể lừa lmer () để làm một cái gì đó phù hợp hơn, mặc dù.
Macro

2
+1 Một câu trả lời ngắn gọn, súc tích giải quyết tất cả các điểm chính mà tôi nghĩ sẽ giải quyết và hơn thế nữa. Liên quan đến các gói trong R, một tìm kiếm Google về CRAN, cho [tạm thời hồi quy poisson] bật lên một số gói. Các surveillancegói có thể có các chức năng mong muốn. Kiểu mô hình này không phải là hiếm trong các nghiên cứu sinh thái, vì vậy có lẽ tốt nhất là tìm một gói tốt trong các ngóc ngách sinh thái của CRAN.
Lặp lại
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.