Làm thế nào để mô hình một đồng xu thiên vị với thời gian thay đổi thiên vị?


10

Các mô hình tiền xu thiên vị thường có một tham số . Một cách để ước tính từ một loạt các lần rút là sử dụng bản beta trước và tính toán phân phối sau với khả năng nhị thức.θ=P(Head|θ)θ

Trong cài đặt của tôi, do một số quy trình vật lý kỳ lạ, các thuộc tính đồng xu của tôi đang dần thay đổi và trở thành chức năng của thời gian . Dữ liệu của tôi là một tập hợp các lệnh rút thăm có nghĩa là . Tôi có thể xem xét rằng tôi chỉ có một lần rút cho mỗi trên một lưới thời gian riêng biệt và thường xuyên.θt{H,T,H,H,H,T,...}t

Làm thế nào bạn sẽ mô hình này? Tôi đang nghĩ về một cái gì đó giống như bộ lọc Kalman thích nghi với thực tế rằng biến ẩn là và giữ khả năng nhị thức. Tôi có thể sử dụng gì để mô hình để duy trì khả năng suy luận?θP(θ(t+1)|θ(t))

Chỉnh sửa các câu trả lời sau (cảm ơn!) : Tôi muốn mô hình hóa dưới dạng Chuỗi Markov theo thứ tự 1 giống như được thực hiện trong các bộ lọc HMM hoặc Kalman. Giả định duy nhất tôi có thể đưa ra là trơn tru. Tôi có thể viết với một tiếng ồn Gaussian nhỏ (ý tưởng bộ lọc Kalman), nhưng điều này sẽ phá vỡ yêu cầu phải duy trì trong . Theo ý tưởng từ @J Dav, tôi có thể sử dụng hàm probit để ánh xạ đường thẳng thực tới , nhưng tôi có trực giác rằng điều này sẽ đưa ra một giải pháp không phân tích. Một bản phân phối beta với trung bìnhθ(t)θ(t)P(θ(t+1)|θ(t))=θ(t)+ϵϵθ[0,1][0,1]θ(t) và một phương sai rộng hơn có thể thực hiện các mẹo.

Tôi đang hỏi câu hỏi này vì tôi có cảm giác rằng vấn đề này đơn giản đến mức nó phải được nghiên cứu trước đây.


Bạn có thể có được ước tính nếu bạn có một mô hình về tỷ lệ chanh thành công theo thời gian. Nhiều mô hình khác nhau sẽ hoạt động và các ước tính có thể thay đổi rất nhiều dựa trên mô hình giả định. Tôi không nghĩ khả năng dễ điều khiển là một tiêu chí thực tế để chọn một mô hình. Tôi muốn hiểu quá trình và tìm kiếm một mô hình thaat thể hiện đặc điểm đồng ý với hành vi mà bạn mong đợi.
Michael R. Chernick

@MichaelCécick: Cảm ơn. Giả định duy nhất tôi có thể đưa ra là đang di chuyển trơn tru và chậm chạp. Hơn nữa, khả năng lưu hành là một tiêu chí quan trọng vì tôi thực sự muốn mở rộng giải pháp cho trường hợp đa biến với các phụ thuộc không tầm thường. Một giải pháp lý tưởng sẽ là phân tích và đưa ra cập nhật 'trực tuyến' các ước tính tham số khi có dữ liệu mới. θ
repied2

1
Bạn có thể định lượng được ý của bạn bằng cách " đang di chuyển trơn tru và chậm chạp?" Các số nguyên là rời rạc, và có các hàm trơn tru đảm nhận các giá trị tùy ý trên các số nguyên, điều đó có nghĩa là độ mịn không có ràng buộc. Một số khái niệm "từ từ" vẫn không đưa ra bất kỳ ràng buộc nào, trong khi một số thì có. θ
Douglas Zare

"Chậm" nhanh như thế nào, như thay đổi xác suất 0,1 / đơn vị thời gian hoặc 0,001 hoặc ... Và bạn dự kiến ​​sẽ có một chuỗi bao lâu? Là phạm vi tương đối hẹp (ví dụ: 0,2 - 0,4) hoặc nó có gần với (0,1) không?
jbowman

@DoumundZare Bởi 'mịn', tôi muốn nói rằng E [θ_t + 1 | θ_t] = θ_t (hoặc rất gần) và VAR (θ_t + 1 | θ_t) nhỏ. không nhảy xung quanh (nếu không thì không thể làm gì thực sự).
repied2

Câu trả lời:


2

Tôi nghi ngờ bạn có thể đưa ra một mô hình với giải pháp phân tích, nhưng suy luận vẫn có thể được thực hiện bằng cách sử dụng các công cụ phù hợp vì cấu trúc phụ thuộc của mô hình của bạn rất đơn giản. Là một nhà nghiên cứu về máy học, tôi thích sử dụng mô hình sau vì suy luận có thể được thực hiện khá hiệu quả bằng cách sử dụng kỹ thuật Tuyên truyền kỳ vọng:

Đặt là kết quả của thử nghiệm thứ . Hãy để chúng tôi xác định tham số thay đổi thời gianX(t)t

η(t+1)N(η(t),τ2) cho .t0

Để liên kết với , hãy giới thiệu các biến tiềm ẩnη(t)X(t)

Y(t)N(η(t),β2) ,

và mô hình làX(t)

X(t)=1 nếu và nếu không. Bạn thực sự có thể bỏ qua và gạt chúng ra chỉ để nói , (với cdf của tiêu chuẩn bình thường) nhưng việc đưa vào các biến tiềm ẩn làm cho suy luận dễ dàng. Ngoài ra, lưu ý rằng trong tham số ban đầu của bạn .Y(t)0X(t)=0Y(t)P[X(t)=1]=Φ(η(t)/β)Φθ(t)=η(t)/β

Nếu bạn quan tâm đến việc thực hiện thuật toán suy luận, hãy xem bài viết này . Họ sử dụng một mô hình rất giống nhau để bạn có thể dễ dàng điều chỉnh thuật toán. Để hiểu EP, trang sau có thể hữu ích. Nếu bạn quan tâm đến việc theo đuổi phương pháp này cho tôi biết; Tôi có thể cung cấp lời khuyên chi tiết hơn về cách thực hiện thuật toán suy luận.


0

Để giải thích về nhận xét của tôi, một mô hình như p (t) = p exp (-t) là một mô hình đơn giản và cho phép ước tính p (t) bằng cách ước tính p bằng cách sử dụng ước tính khả năng tối đa. Nhưng xác suất thực sự phân rã theo cấp số nhân. Mô hình này sẽ sai rõ ràng nếu bạn quan sát các khoảng thời gian với tần suất thành công cao hơn so với bạn quan sát ở thời điểm trước và sau này. Hành vi dao động có thể được mô hình hóa thành p (t) = p | sint |. Cả hai mô hình đều rất dễ điều khiển và có thể được giải quyết bằng khả năng tối đa nhưng chúng đưa ra các giải pháp rất khác nhau.000


1
Dường như OP đang tìm cách mô hình xác suất thành công tại thời điểm , , như một quy trình markovian, không chỉ định một số dạng chức năng cho . tθ(t)θ(t)
Macro

1
@macro đã đúng, tôi không thể cung cấp một hình thức tham số cho và điều này là không mong muốn vì chức năng này có thể là bất cứ điều gì trơn tru. Tôi muốn một mô hình Markov có thứ tự 1 tương tự như Mô hình Markov ẩn hoặc bộ lọc Kalman, nhưng với một biến ẩn có giá trị thực từ 0 đến 1, và với khả năng Bernouilli. theta(t)
repied2

@pierre Được rồi trước khi chỉnh sửa, có vẻ như bạn đang tìm cách ước tính thời gian thay đổi p và chỉ đề xuất HMM như một cách tiếp cận có thể. Tôi đã không đề xuất một hình thức chức năng cho cách nó thay đổi với t. Tôi đã đưa ra quan điểm rằng nếu không có thêm thông tin, nhiều mô hình thuộc nhiều loại khác nhau có thể được xây dựng và hai ví dụ của tôi là cho thấy rằng nếu không có thêm các lựa chọn mô hình thông tin có thể đưa ra các câu trả lời rất khác nhau. Tại sao bạn nhấn mạnh vào HMM? Nếu một người làm việc và phù hợp với dữ liệu của bạn tại sao lại từ chối vì đó là "không phân tích.
Michael R. Chernick

Tôi đề nghị rằng việc tìm giải pháp thuận tiện không phải là cách để giải quyết các vấn đề thống kê thực tế!
Michael R. Chernick

1
@MichaelCécick Cuối cùng: Tôi muốn tìm một giải pháp phân tích vì tôi hy vọng đây là một vấn đề nổi tiếng và mọi người đề xuất giải pháp phân tích đủ linh hoạt. Nhưng tôi đồng ý với đề xuất của chúng tôi rằng mô hình hóa 'động lực học thực sự' quan trọng hơn chi phí tính toán nói chung. Đáng buồn thay, đây là dữ liệu lớn và một thuật toán chậm sẽ vô dụng :-(
repied2

0

Xác suất của bạn thay đổi theo nhưng như Michael nói, bạn không biết làm thế nào. tuyến tính hay không? Có vẻ như một vấn đề lựa chọn mô hình trong đó xác suất của bạn :tp

p=Φ(g(t,θ)) có thể phụ thuộc vào hàm phi tuyến tính cao . chỉ là một hàm giới hạn đảm bảo từ 0 đến 1 xác suất.g(t,θ)Φ

Một cách tiếp cận khám phá đơn giản sẽ là thử một vài thử nghiệm cho với phi tuyến tính khác nhau và thực hiện lựa chọn mô hình dựa trên Tiêu chí thông tin tiêu chuẩn.Φg()g()

Để trả lời câu hỏi được chỉnh sửa lại của bạn :

Như bạn đã nói sử dụng probit sẽ chỉ ngụ ý các giải pháp số nhưng thay vào đó bạn có thể sử dụng hàm logistic:

Hàm logistic:P[θ(t+1)]=11+exp(θ(t)+ϵ)

Được tuyến tính hóa bởi:logP1P=θ(t)+ϵ

Tôi không chắc làm thế nào điều này có thể hoạt động theo phương pháp tiếp cận bộ lọc Kalman, nhưng vẫn tin rằng một đặc tả phi tuyến tính như hoặc nhiều người khác không có thuật ngữ ngẫu nhiên sẽ thực hiện công việc. Như bạn có thể thấy chức năng này là "smoth" theo nghĩa là nó liên tục và khác biệt. Thật không may, việc thêm sẽ tạo ra các bước nhảy về xác suất kết quả là điều bạn không muốn vì vậy lời khuyên của tôi là hãy loại bỏ .θ(t+1)=at3+bt2+ct+dϵϵ

Đăng nhập xác suất:P[Coint+1=H|t]=11+exp(θ(t))

Bạn đã có ngẫu nhiên trong sự kiện bernoulli (Chuỗi Markov) và bạn đang thêm một nguồn bổ sung của nó do . Do đó, vấn đề của bạn có thể được giải quyết dưới dạng Probit hoặc Logit được ước tính theo khả năng tối đa với là biến giải thích. Tôi cho rằng bạn đồng ý rằng sự khôn ngoan là rất quan trọng. Trừ khi mục tiêu chính của bạn là áp dụng một phương pháp nhất định (Bộ lọc HMM và Kalman) và không đưa ra giải pháp hợp lệ đơn giản nhất cho vấn đề của bạn.ϵt


Nếu bạn sử dụng một probit, một phần mở rộng đa biến rất đơn giản vì một probit đa biến có thể được ước tính. Sự phụ thuộc sẽ được ẩn theo ma trận hiệp phương sai của phân phối chuẩn nhiều biến số ngụ ý.
JDav
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.