Kiểm tra xem hai mẫu Poisson có cùng giá trị trung bình không


30

Đây là một câu hỏi cơ bản, nhưng tôi không thể tìm thấy câu trả lời. Tôi có hai phép đo: n1 sự kiện trong thời gian t1 và n2 sự kiện trong thời gian t2, cả hai được tạo ra (nói) bởi các quá trình Poisson với các giá trị lambda có thể khác nhau.

Đây thực sự là từ một bài báo, trong đó chủ yếu tuyên bố rằng vì rằng hai cái này khác nhau, nhưng tôi không chắc rằng tuyên bố đó là hợp lệ. Giả sử rằng các khoảng thời gian không được chọn độc hại (để tối đa hóa các sự kiện ở cái này hay cái khác).n1/t1n2/t2

Tôi chỉ có thể làm một t- test, hoặc sẽ không phù hợp? Số lượng sự kiện quá nhỏ để tôi có thể thoải mái gọi các bản phân phối gần như bình thường.



1
Mẫu vật tốt đẹp của báo chí khoa học, ở đó ...
Matt Parker

1
Vâng ... bạn có thể thấy lý do tại sao tôi muốn kiểm tra số liệu thống kê được sử dụng.
Charles

Câu trả lời:


25

Để kiểm tra giá trị trung bình của Poisson, phương pháp có điều kiện được đề xuất bởi Przyborowski và Wilenski (1940). Phân phối có điều kiện của X1 đã cho X1 + X2 tuân theo phân phối nhị thức có xác suất thành công là hàm của tỷ lệ hai lambda. Do đó, kiểm tra giả thuyết và các thủ tục ước lượng khoảng có thể dễ dàng được phát triển từ các phương pháp chính xác để đưa ra suy luận về xác suất thành công của nhị thức. Thường có hai phương pháp được xem xét cho mục đích này,

  1. Kiểm tra C
  2. Kiểm tra điện tử

Bạn có thể tìm thấy chi tiết về hai bài kiểm tra này trong bài báo này. Một thử nghiệm mạnh mẽ hơn để so sánh hai phương tiện Poisson


4
+1 Tham khảo tốt, cảm ơn. Bài kiểm tra C là phiên bản nghiêm ngặt hơn của bản tôi đã phác thảo, vì vậy nó rất đáng để xem xét. E-test liên quan đến thống kê t với phân phối thích hợp. Tính toán phân phối đó bao gồm một tổng vô hạn gấp đôi sẽ lấy các phép tính để hội tụ: khá dễ viết mã, có thể là quá mức cần thiết để kiểm tra tờ báo! O(n1n2)
whuber

1
Tác giả của bài kiểm tra E đã viết một triển khai fortran đơn giản để tính giá trị p cho hai poisson có nghĩa ở đây: ucs.louisiana.edu/~kxk4695 Tôi đã chuyển fortran của họ sang MATLAB tại đây git.io/vNP86
AndyL

11

Làm thế nào về:

poisson.test(c(n1, n2), c(t1, t2), alternative = c("two.sided"))

Đây là một thử nghiệm so sánh tỷ lệ Poisson 1 và 2 với nhau, và cho cả giá trị ap và khoảng tin cậy 95%.


Cần lưu ý rằng đối với bài toán hai mẫu, bài kiểm tra này sử dụng phép thử nhị thức để so sánh tỷ lệ
Jon

10

Bạn đang tìm kiếm một kiểm tra nhanh chóng và dễ dàng.

λt=t1+t2[0,t1]n1[t1,t1+t2]n2

λ^=n1+n2t1+t2

nitiλ^ntôiđược đặt trên đuôi của phân phối này, rất có thể khiếu nại là hợp lệ; nếu không, yêu cầu có thể dựa vào sự thay đổi cơ hội.


1
Cảm ơn (+1), đó chỉ là kiểm tra đúng đắn cho loại điều lạ thường này. Nó đã kết thúc rất có ý nghĩa (p = 0,005) vì vậy bài viết là tốt. Tuy nhiên, tôi hy vọng bạn không bận tâm rằng tôi đã chấp nhận câu trả lời khác - thật tốt khi biết cách 'thực sự' để làm điều đó khi nó quan trọng.
Charles

5

Tôi sẽ quan tâm đến một khoảng tin cậy hơn giá trị ap, đây là một xấp xỉ bootstrap.

Tính độ dài của các khoảng đầu tiên và kiểm tra:

Lrec = as.numeric(as.Date("2010-07-01") - as.Date("2007-12-02")) # Length of recession
Lnrec = as.numeric(as.Date("2007-12-01") - as.Date("2001-12-01")) # L of non rec period
(43/Lrec)/(50/Lnrec)

[1] 2.000276

Kiểm tra này cho kết quả hơi khác (tăng 100,03%) so với kết quả của ấn phẩm (tăng 101%). Tiếp tục với bootstrap (thực hiện hai lần):

N = 100000
k=(rpois(N, 43)/Lrec)/(rpois(N, 50)/Lnrec)
c(quantile(k, c(0.025, .25, .5, .75, .975)), mean=mean(k), sd=sd(k))

     2.5%       25%       50%       75%     97.5%      mean        sd 
1.3130094 1.7338545 1.9994599 2.2871373 3.0187243 2.0415132 0.4355660 

     2.5%       25%       50%       75%     97.5%      mean        sd 
1.3130094 1.7351970 2.0013578 2.3259023 3.0173868 2.0440240 0.4349706 

Khoảng tin cậy 95% của mức tăng là 31% đến 202%.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.