So sánh tỷ lệ mới mắc


9

Tôi muốn so sánh tỷ lệ mắc giữa hai nhóm (một nhóm không mắc bệnh và một nhóm mắc bệnh).

Tôi đã lên kế hoạch tính tỷ lệ tỷ lệ mới mắc (IRR), tức là tỷ lệ mới mắc nhóm B / tỷ lệ mới mắc nhóm A, và sau đó kiểm tra xem tỷ lệ này có bằng 1 hay không, và cuối cùng tính khoảng 95% CI cho IRR.

Tôi đã tìm thấy một phương pháp để tính toán 95% CI trong một cuốn sách ( Nguyên tắc cơ bản về sinh học của Rosner ):

điểm kinh nghiệm[đăng nhập(IRR)±1,96(1/một1)+(1/một2)]

nơi và là số lượng các sự kiện. Nhưng phép tính gần đúng này chỉ hợp lệ đối với các cỡ mẫu đủ lớn và tôi nghĩ rằng số lượng sự kiện tôi có là nhỏ (có thể với tổng so sánh thì không sao.)một1một2

Vì vậy, tôi nghĩ rằng tôi nên sử dụng một phương pháp khác.

Im sử dụng R và exactci gói và thấy rằng tôi có thể có thể sử dụng poisson.test(). Nhưng hàm này có 3 phương thức để xác định hai giá trị p: trung tâm, minlike và blaker.

Vì vậy, câu hỏi của tôi là:

  1. Có đúng không khi so sánh hai tỷ lệ tỷ lệ mới mắc bằng cách sử dụng một bài kiểm tra để so sánh tỷ lệ poisson?

  2. Khi sử dụng hàm poisson.test trong R từ gói chính xác, phương pháp nào là tốt nhất?

Các họa tiết cho chính xác nói:

trung tâm: gấp 2 lần giá trị p một phía giới hạn ở trên 1. Tên 'trung tâm' được thúc đẩy bởi các khoảng đảo ngược liên kết là các khoảng trung tâm, nghĩa là chúng đảm bảo rằng tham số thực có ít hơn xác suất nhỏ hơn (nhiều hơn) so với đuôi dưới (trên) của khoảng tin cậy 100 (1- )%. Đây được gọi là TST (gấp đôi phương pháp đuôi nhỏ hơn) của Hirji (2006).α/2α

minlike: là tổng xác suất của các kết quả có khả năng nhỏ hơn hoặc bằng khả năng quan sát được. Đây được gọi là phương pháp PB (dựa trên xác suất) của Hirji (2006).

blaker: kết hợp xác suất của đuôi quan sát nhỏ hơn với xác suất nhỏ nhất của đuôi đối diện không vượt quá xác suất đuôi quan sát được. Cái tên 'blaker' được thúc đẩy bởi Blaker (2000), nghiên cứu toàn diện phương pháp liên quan cho các khoảng thời gian. Đây được gọi là phương pháp CT (đuôi kết hợp) bởi Hirji (2006).

Dữ liệu của tôi là:

Group A: 
Age group 1: 3 cases    in 10459 person yrs.   Incidence rate: 0.29 
Age group 2: 7 cases    in 2279 person yrs.    Incidence rate: 3.07
Age group 3: 4 cases    in 1990 person yrs.    Incidence rate: 2.01
Age group 4: 9 cases    in 1618 person yrs.    Incidence rate: 5.56
Age group 5: 11 cases   in 1357 person yrs.    Incidence rate: 8.11
Age group 6: 11 cases   in 1090 person yrs.    Incidence rate: 10.09
Age group 7: 9 cases    in 819 person yrs.     Incidence rate: 10.99
  Total:    54 cases in 19612 person yrs.      Incidence rate: 2.75

Group B: 
Age group 1: 3 cases    in 3088 person yrs.   Incidence rate: 0.97 
Age group 2: 1 cases    in 707 person yrs.    Incidence rate: 1.41
Age group 3: 2 cases    in 630 person yrs.    Incidence rate: 3.17
Age group 4: 6 cases    in 441 person yrs.    Incidence rate: 13.59
Age group 5: 10 cases   in 365 person yrs.    Incidence rate: 27.4
Age group 6: 6 cases   in 249 person yrs.    Incidence rate: 24.06
Age group 7: 0 cases    in 116 person yrs.     Incidence rate: 0
  Total:    28 cases in 5597 person yrs.      Incidence rate: 5.0

Câu trả lời:


2

Một vài suy nghĩ:

Đầu tiên, so sánh được đề xuất của bạn - tỷ lệ sự cố giữa A và B - hiện không được quy định trên bất kỳ hiệp phương sai nào. Điều đó có nghĩa là số lượng sự kiện của bạn là 54 cho Nhóm A và 28 cho Nhóm B. Điều đó là quá đủ để sử dụng các Phương pháp Khoảng tin cậy dựa trên mẫu lớn thông thường.

Thứ hai, ngay cả khi bạn có ý định điều chỉnh ảnh hưởng của tuổi tác, thay vì tính toán tỷ lệ cho từng nhóm, bạn có thể được phục vụ tốt hơn bằng cách sử dụng phương pháp hồi quy. Nói chung, nếu bạn phân tầng theo nhiều cấp độ của một biến, nó trở nên khá cồng kềnh so với phương trình hồi quy, điều này sẽ cho bạn tỷ lệ của tỷ lệ A và B trong khi kiểm soát Tuổi. Tôi tin rằng các phương pháp tiêu chuẩn vẫn sẽ hiệu quả với kích thước mẫu của bạn, mặc dù nếu bạn lo lắng về nó, bạn có thể sử dụng một cái gì đó như glmperm .


1

Tỷ lệ mới mắc của mỗi nhóm trong dữ liệu của bạn chỉ là giá trị trung bình của tổng các biến Bernoulli (0/1) độc lập - mỗi bệnh nhân có một biến riêng nhận giá trị 0 hoặc 1, bạn tổng hợp chúng và lấy giá trị trung bình là tỷ lệ mới mắc.

Tôi mẫu lớn (và mẫu của bạn lớn), giá trị trung bình sẽ được phân phối bình thường, vì vậy bạn có thể sử dụng kiểm tra z đơn giản để kiểm tra xem hai tỷ lệ có khác nhau hay không.

Trong R, hãy xem prop.test: http://stat.ethz.ch/R-manual/R-patched/l Library / stat / html / prop.test.html

Nếu bạn muốn sử dụng toàn bộ dữ liệu, hãy thử xem liệu phân phối tỷ lệ mới mắc có khác nhau giữa nhóm A và B. Đối với điều đó, một thử nghiệm về tính độc lập có thể thực hiện thủ thuật, chẳng hạn như bình phương chi G -test: http://udel.edu/~mcdonald/statchiind.html


0

Cách duy nhất để chắc chắn rằng mẫu đủ lớn (hoặc như Charlie Geyer sẽ đặt nó - rằng bạn thực sự đang ở vùng đất không đối xứng ) là thực hiện nhiều mô phỏng Monte-Carlo hoặc như EpiGard đề nghị sử dụng một cái gì đó như glmperm.

Đối với phương pháp nào là tốt nhất trong chính xác, không có phương pháp nào tốt nhất ở đây - hoặc như Fisher đã sử dụng để đặt nó

Tốt nhất để làm gì?

Michael Fay cung cấp một số làm rõ ở đây

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.