kiểm tra xem một chuỗi markov có bằng chuỗi lý thuyết không


8

Tôi đã có một ma trận đếm chuyển tiếp theo kinh nghiệm Q. Tôi có một chuỗi Markov theo thứ tự lý thuyết đầu tiên P. Nói N là số lần chuyển đổi. Tôi muốn kiểm tra xem Q có tương thích với P. Có đúng không khi tìm ma trận chuyển tiếp đếm lý thuyết (N * P) tính toán thống kê chi bình phương, i,jK(Qij(NPij))2NPij , và sau đó tính giá trị p của mộtχ2phân phối vớiK(K1)bậc tự do?


2
Tôi không quen thuộc lắm với các bài kiểm tra chi bình phương, nhưng lướt qua, nó dường như được sử dụng phổ biến cho dữ liệu đa phương thức (ví dụ ở đây ). Tôi sẽ nghĩ rằng mỗi hàng P nên tương ứng với một phân phối đa quốc gia? Vì vậy, sau đó bạn có thể sử dụng ni cho hàng i , nghĩa là số lần chuyển đổi "từ i ". Đó là, " N " có thể thay đổi tùy thuộc vào trạng thái bắt đầu?
GeoMatt22

Câu trả lời:


5

Pij=Pr[ji],Qij=t=1N[xt=i&xt+1=j]
i
pi=Pi,:,ni=j=1KQij

Tôi không chắc chắn rằng bạn có thể gộp tất cả các hàng lại với nhau, bởi vì "số lượng thử nghiệm" sẽ khác nhau giữa các hàng.

Ví dụ: nói và dữ liệu của bạn là . Vì vậy, có chuyển tiếp, với đến từ , nhưng từ và chỉ và từ . Vì vậy, tôi nghĩ rằng sự tin tưởng của bạn vào thường cao hơn niềm tin của bạn vào .K=3x=[1,1,2,1,2,3,1,2]N=7n1=4x=1n2=2x=2n3=1x=3p^1p^3

(Trong trường hợp cực đoan, có thể trong ví dụ này thực sự là , nhưng bạn không có dữ liệu nào về các chuyển đổi đó, vì Xử lý "không có bằng chứng là bằng chứng vắng mặt" có vẻ là vấn đề đối với tôi ở đây.)K4n4=0

Tôi không quen thuộc lắm với các bài kiểm tra chi bình phương, nhưng điều này cho thấy bạn có thể muốn xử lý các hàng một cách độc lập (nghĩa là chỉ tổng trên và sử dụng thay vì ). Lý do này dường như không cụ thể đối với thử nghiệm chi bình phương, do đó, cũng nên áp dụng cho bất kỳ thử nghiệm quan trọng nào khác mà bạn có thể sử dụng (ví dụ: đa thức chính xác ).jniN

Vấn đề chính là xác suất chuyển tiếp là có điều kiện , do đó, đối với mỗi lần nhập ma trận, chỉ có các chuyển đổi thỏa mãn điều kiện trước của nó là phù hợp. Thật vậy, có lẽ ma trận chuyển tiếp sẽ thỏa mãn , do đó "ma trận chuyển tiếp theo kinh nghiệm" phải là .jPij=1P^ij=Qij/ni


Cập nhật: Đáp lại truy vấn của OP, làm rõ về "tham số kiểm tra".

Nếu có các trạng thái trong chuỗi Markov, tức là , thì đối với hàng , phân phối đa thức tương ứng sẽ có vectơ xác suất và số lượng thử nghiệm , được đưa ra ở trên.KPRK×KipiRKniN

Vì vậy, sẽ có loại và vectơ xác suất sẽ có bậc tự do, như . Vì vậy, cho hàng tương ứng Thống kê sẽ là mà sẽ tiệm cận theo một bình phương phân phối với độ tự do (như đã nêu ở đâyở đây ). Xem thêm tại đây để thảo luận về thời điểm thử nghiệm là phù hợp và các thử nghiệm thay thế có thể phù hợp hơn.KpiK1j=1K(pi)j=1iχ2

χi2=j(QijniPij)2niPij
K1χ2

thể thực hiện "kiểm tra gộp", giả sử tuân theo phân phối chi bình phương với các (nghĩa là tổng hợp các dofs trên các hàng). Tuy nhiên tôi không chắc chắn liệu có thể được coi là độc lập hay không. Trong mọi trường hợp, các bài kiểm tra theo hàng có vẻ nhiều thông tin hơn, do đó có thể thích hợp hơn so với kiểm tra gộp.χP2=iχi2K(K1)χi2


Thông minh ý tưởng để coi nó như là một phân phối đa quốc gia. Tổng của hai biến Chi bình phương là bình phương chi nên thống kê kiểm tra cho mỗi hàng có thể được tách riêng thành máy tính và tổng hợp lại với nhau để đưa ra thống kê kiểm tra chi bình phương mới. Điều này sẽ có mức độ tự doNK
Hugh

@Hugh Tôi không đủ quen để đánh giá, nhưng điều này rất có thể là hợp lý. Quan điểm chính của tôi là nhiều hơn rằng cách tiếp cận "theo từng hàng" có vẻ hợp lý và nhiều thông tin hơn so với cách tiếp cận "gộp". (Tôi đoán một điểm phụ là tất cả các công việc trên bình phương cho đa thức, ví dụ như hội tụ tiệm cận, có thể là một điểm khởi đầu tốt. Mặc dù vậy, tất cả những gì tôi biết về những chủ đề này tôi đã học được từ việc lướt qua các bài viết CV, vì vậy đó là về tất cả tôi có thể cung cấp!) Bạn có thể xem xét đăng một câu trả lời ngắn đề cập đến khía cạnh chi bình phương trực tiếp hơn.
GeoMatt22

@ GeoMatt22 ... Vậy có ổn không, số bậc tự do cho phép thử Chi-Square bằng với là N có kích thước của dtmc? N2N
Giorgio Speesato

Giorgio, xem cập nhật của tôi.
GeoMatt22

@Hugh vui lòng xem câu trả lời cập nhật của tôi. Lưu ý rằng Wikipedia nói "Cần lưu ý rằng mức độ tự do không dựa trên số lượng quan sát". Tôi không chắc liệu của tôi cho "bài kiểm tra gộp" có đúng không, nhưng cũng không chắc chắn nơi mà dof của bạn sẽ đến từ đâu! Bất kỳ làm rõ? K(K1)NK
GeoMatt22
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.