Làm thế nào để dự đoán khi sự kiện tiếp theo xảy ra, dựa trên thời gian của các sự kiện trước đó?


19

Tôi là một học sinh cấp ba và tôi đang làm việc trong một dự án lập trình máy tính, nhưng tôi không có nhiều kinh nghiệm về thống kê và mô hình hóa dữ liệu ngoài một khóa học thống kê ở trường trung học nên tôi hơi bối rối.

Về cơ bản, tôi có một danh sách khá lớn (giả sử nó đủ lớn để đáp ứng các giả định cho bất kỳ kiểm tra hoặc biện pháp thống kê nào) về thời gian mà ai đó quyết định in tài liệu. Dựa trên danh sách này, tôi muốn xây dựng một mô hình thống kê thuộc loại nào đó sẽ dự đoán thời gian có khả năng nhất cho công việc in tiếp theo với tất cả các lần sự kiện trước đó.

Tôi đã đọc điều này , nhưng các phản hồi không giúp chính xác những gì tôi nghĩ cho dự án của mình. Tôi đã thực hiện một số nghiên cứu bổ sung và thấy rằng Mô hình Markov ẩn có thể sẽ cho phép tôi thực hiện chính xác, nhưng tôi không thể tìm thấy liên kết về cách tạo Mô hình Markov ẩn chỉ bằng một danh sách thời gian. Tôi cũng thấy rằng việc sử dụng bộ lọc Kalman trong danh sách có thể hữu ích nhưng về cơ bản, tôi muốn nhận thêm một số thông tin về nó từ một người thực sự sử dụng chúng và biết những hạn chế và yêu cầu của họ trước khi thử một cái gì đó và hy vọng nó hoạt động.

Cảm ơn nhiều!


1
+1 Đây là một câu hỏi được nói rõ, được suy nghĩ kỹ, Ankush. Tôi hy vọng bạn nhận được một số phản hồi tuyệt vời. Chào mừng đến với trang web của chúng tôi!
whuber

Cảm ơn bạn đã sửa tiêu đề - Tôi đã chuyển các từ xung quanh để cố gắng làm cho mọi thứ mạch lạc hơn và tôi đoán rằng cuối cùng tôi đã làm cho nó không có ý nghĩa gì cả! Hy vọng ai đó có kiến ​​thức phù hợp có thể giúp đỡ.
ankushg

Câu trả lời:


10

Các mô hình Markov ẩn sẽ được áp dụng nếu dữ liệu là phát thải ngẫu nhiên từ một số mô hình Markov không được quan sát cơ bản; Tôi sẽ không loại trừ điều đó, nhưng nó không có vẻ là một mô hình rất tự nhiên.

Tôi sẽ nghĩ về các quy trình điểm , phù hợp với dữ liệu cụ thể của bạn. Có rất nhiều công việc để dự đoán động đất (mặc dù tôi không biết nhiều về nó) và thậm chí là tội phạm .

Nếu có nhiều người khác nhau in và bạn chỉ nhìn thấy thời gian nhưng không phải là danh tính cá nhân, một quy trình Poisson có thể hoạt động tốt (sự chồng chất của nhiều quá trình điểm độc lập là xấp xỉ Poisson), mặc dù nó sẽ không đồng nhất ( cơ hội của một điểm thay đổi theo thời gian): mọi người ít có khả năng in vào lúc 3 giờ sáng hơn lúc 3 giờ chiều.

Đối với mô hình quy trình Poisson không đồng nhất , chìa khóa sẽ có được ước tính tốt về cơ hội của công việc in tại một thời điểm cụ thể vào một ngày cụ thể.

Tuy nhiên, nếu thời gian in này dành cho sinh viên trong một lớp học, điều đó có thể khá khó khăn, vì họ không có khả năng độc lập và vì vậy quy trình Poisson sẽ không hoạt động tốt.

Đây là một liên kết đến một bài báo về ứng dụng tội phạm.


Cảm ơn vì điều đó. Bạn có biết cách nào để tạo một mô hình cho một quy trình điểm không? Nó có vẻ phù hợp nhất, nhưng tôi không rành về thống kê nên tất cả có vẻ khó hiểu (Poisson vs Xác định vs Cox?) Khi tôi đang đọc wikipedia ...: - \
ankushg

@Unk - Tôi sẽ bắt đầu bằng cách tạo ra một số lô dữ liệu. Danh sách thời gian in này dài bao lâu?
Karl

Đó là về dữ liệu của một năm. Tôi sẽ thực hiện một số âm mưu và cho bạn biết làm thế nào nó đi.
ankushg

1

Dựa trên dự đoán thời gian có thể sử dụng thống kê quét Bayesian đa biến (MBSS) có thể hỗ trợ. MBSS này có lợi thế là cải thiện tính kịp thời và chính xác của việc phát hiện sự kiện.


Chào mừng đến với trang web, @Esan. Bạn có thể nói thêm về MBSS, cách thức hoạt động và cách thức hoạt động không?
gung - Phục hồi Monica
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.