Sử dụng phân tích chuỗi thời gian để phân tích / dự đoán hành vi bạo lực


13

Đây là một chút của một câu hỏi flippant, nhưng tôi có một quan tâm nghiêm túc trong câu trả lời. Tôi làm việc trong một bệnh viện tâm thần và tôi có ba năm dữ liệu, được thu thập mỗi ngày trên mỗi phường về mức độ bạo lực ở phường đó.

Rõ ràng mô hình phù hợp với những dữ liệu này là mô hình chuỗi thời gian. Tôi phải phân biệt điểm số để khiến chúng bình thường hơn. Tôi phù hợp với một mô hình ARMA với dữ liệu khác biệt và phù hợp nhất tôi nghĩ là một mô hình với một mức độ khác biệt và tương quan tự động thứ tự đầu tiên ở độ trễ 2.

Câu hỏi của tôi là, tôi có thể sử dụng mô hình này để làm gì? Chuỗi thời gian dường như luôn rất hữu ích trong sách giáo khoa khi nói về dân số và giá dầu, nhưng bây giờ tôi đã tự mình thực hiện kết quả có vẻ trừu tượng đến mức hoàn toàn mờ đục. Các điểm số khác nhau tương quan với nhau ở độ trễ hai, nhưng tôi thực sự không thể khuyên mọi người nên cảnh giác cao độ hai ngày sau khi xảy ra sự cố nghiêm trọng.

Hay tôi có thể?


bạn có thể chỉnh sửa tiêu đề thành một cái gì đó như "Sử dụng phân tích chuỗi thời gian để phân tích / dự đoán hành vi bạo lực" không?
Paul

1
Tôi thực sự thích loại câu hỏi này, tôi nghĩ loại vấn đề thực sự chính xác này sẽ làm tăng sự quan tâm của trang web. Sẽ tốt hơn nữa nếu bạn có khả năng thêm một liên kết đến dữ liệu hoặc cho chúng tôi biết (như một phần bổ sung cho bài đăng) những gì bạn cuối cùng đã làm, kết luận là gì .... tuy nhiên tôi hiểu rằng điều này có thể là bí mật ...
robin girard

Tôi xin phép tôi có thể bỏ phiếu một lần nữa để khiến bạn vượt qua câu hỏi về định nghĩa của một biến ngẫu nhiên;)
robin girard

Tôi sẽ quay lại để cho bạn biết kết quả là gì, nhưng sẽ mất một lúc khi tôi thực hiện theo cách này cùng với rất nhiều nhiệm vụ khác. Bạn không chắc chắn ý của bạn về "vượt qua câu hỏi về biến ngẫu nhiên"? Có một câu hỏi mà bạn đề nghị tôi nhìn vào?
Chris Beeley

xin lỗi nếu tôi không rõ ràng, ý tôi không phải là tôi thích câu hỏi (ý kiến ​​chủ quan cá nhân) như câu hỏi của bạn hơn câu hỏi "biến ngẫu nhiên là gì" ... nhưng tôi đoán rằng niềm vui của tôi không phải là của mọi người :)
robin girard

Câu trả lời:


9

Mô hình phù hợp với dữ liệu không nhất thiết phải là mô hình chuỗi thời gian; Tôi sẽ khuyên bạn nên suy nghĩ bên ngoài hộp một chút.

Nếu bạn có nhiều biến số (ví dụ tuổi, giới tính, chế độ ăn uống, dân tộc, bệnh tật, thuốc men), bạn có thể sử dụng những biến số này cho một mô hình khác. Có lẽ có một số bệnh nhân trong cùng một phòng là một yếu tố dự báo quan trọng? Hoặc có lẽ nó phải làm với các nhân viên tham dự? Hoặc xem xét sử dụng mô hình chuỗi thời gian đa biến (ví dụ VECM) nếu bạn có các biến khác mà bạn có thể sử dụng. Nhìn vào mối quan hệ giữa bạo lực giữa các bệnh nhân: một số bệnh nhân có hành động cùng nhau không?

Mô hình chuỗi thời gian là hữu ích nếu thời gian có một số vai trò quan trọng trong hành vi. Ví dụ, có thể có một nhóm bạo lực. Nhìn vào văn học cụm biến động. Như @Jonas gợi ý, với độ trễ là 2, bạn có thể cần phải cảnh giác cao hơn vào ngày sau khi xảy ra bạo lực. Nhưng điều đó không giúp bạn ngăn chặn ngày đầu tiên: có thể có những thông tin khác mà bạn có thể liên kết vào phân tích để thực sự hiểu nguyên nhân của bạo lực, thay vì chỉ đơn giản là bỏ qua nó theo kiểu thời gian.

Cuối cùng, như một gợi ý kỹ thuật: nếu bạn đang sử dụng R để phân tích, bạn có thể xem gói dự báo từ Rob Hyndman (người tạo ra trang web này). Điều này có nhiều tính năng rất hay; xem bài viết "Dự báo chuỗi thời gian tự động: Gói dự báo cho R" trong Tạp chí phần mềm thống kê.


1
Đồng ý - chỉ cần đưa ra một số ý tưởng bổ sung về mô hình hóa: logistic để dự đoán bệnh nhân nào sẽ có hơn 1 lần bùng phát dữ dội, hồi quy Poisson (esque) để dự đoán bệnh nhân nào sẽ có nhiều vụ nổ, đa cấp để kiểm tra các biến thể từ phòng này sang phòng khác và / hoặc phường-phường ...
Matt Parker

1
+1 Rất dễ bị mù bởi những lời hô hào không sử dụng các mô hình tuyến tính, v.v., theo chuỗi thời gian vì các vấn đề tương quan tự động và bị cuốn vào ARIMA, DLM, v.v., khi LM, GLM, v.v. một chút thận trọng.
Wayne

6

Bạn đã trang bị mô hình cho sự khác biệt, điều đó có nghĩa là bạn đang mô tả sự thay đổi về mức độ bạo lực. Bạn nhận được độ trễ 2 ngày. Một độ trễ là biểu thị của bộ nhớ của quá trình. Nói cách khác, sự thay đổi về mức độ bạo lực ngày nay có một số sự phụ thuộc vào sự thay đổi mức độ bạo lực trong hai ngày qua. Đối với quy mô thời gian dài hơn, sự đóng góp của các ảnh hưởng ngẫu nhiên trở nên đủ mạnh để không còn liên kết rõ ràng nữa.

Là tương quan tự động tích cực? Sau đó, một sự thay đổi về mức độ bạo lực ngày nay cho thấy một sự thay đổi tương tự về mức độ bạo lực trong hai ngày. Có tiêu cực không? Sau đó, bạo lực có thể ở lại cao hơn trong hai ngày.

Tất nhiên, bạn có thể muốn kiểm soát các hiệu ứng gây nhiễu. Ví dụ, sau một sự cố nghiêm trọng, mọi người có thể sẽ báo cáo các sự cố nhỏ hơn, nhưng "sự nhạy cảm" này sẽ biến mất sau hai ngày.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.