Làm thế nào để bạn giải thích sự khác biệt giữa rủi ro tương đối và rủi ro tuyệt đối?


12

Hôm nọ tôi đã tham khảo ý kiến ​​của một nhà dịch tễ học. Cô là một MD có bằng y tế công cộng về dịch tễ học và có nhiều hiểu biết về thống kê. Cô cố vấn nghiên cứu sinh và cư dân của mình và giúp họ với các vấn đề thống kê. Cô ấy hiểu thử nghiệm giả thuyết khá tốt. Cô ấy có một vấn đề điển hình là so sánh hai nhóm để xem liệu có sự khác biệt về nguy cơ liên quan đến suy tim xung huyết (CHF) hay không. Cô đã kiểm tra sự khác biệt trung bình trong tỷ lệ đối tượng mắc CHF. Giá trị p là 0,08. Sau đó, cô cũng quyết định xem xét rủi ro tương đối và có giá trị p là 0,027. Vì vậy, cô hỏi tại sao một điều đáng kể và người kia thì không. Nhìn vào khoảng tin cậy hai mặt 95% cho sự khác biệt và về tỷ lệ, cô thấy rằng khoảng chênh lệch trung bình chứa 0 nhưng giới hạn tin cậy trên cho tỷ lệ này nhỏ hơn 1. Vậy tại sao chúng ta lại nhận được kết quả không nhất quán. Câu trả lời của tôi trong khi đúng kỹ thuật là không thỏa đáng. Tôi nói "Đây là những thống kê khác nhau và có thể cho kết quả khác nhau. Các giá trị p đều nằm trong phạm vi có ý nghĩa biên. Điều này có thể dễ dàng xảy ra." Tôi nghĩ rằng phải có những cách tốt hơn để trả lời điều này theo thuật ngữ của giáo dân cho các bác sĩ để giúp họ hiểu sự khác biệt giữa thử nghiệm rủi ro tương đối so với rủi ro tuyệt đối. Trong các nghiên cứu epi, vấn đề này xuất hiện rất nhiều bởi vì họ thường xem xét các sự kiện hiếm gặp trong đó tỷ lệ mới mắc cho cả hai nhóm rất nhỏ và kích thước mẫu không lớn lắm. Tôi đã suy nghĩ về điều này một chút và có một số ý tưởng mà tôi sẽ chia sẻ. Nhưng trước tiên tôi muốn nghe một số bạn sẽ xử lý việc này như thế nào. Tôi biết rằng nhiều bạn làm việc hoặc tư vấn trong lĩnh vực y tế và có lẽ đã phải đối mặt với vấn đề này. Bạn sẽ làm gì?


Các mô hình có bao gồm các đồng biến khác bên cạnh hiệu ứng nhóm không?
vào

@onestop Có những đồng biến mà họ quan tâm khi xem nhưng thử nghiệm thực tế chỉ là so sánh hiệu quả chính. Nếu bạn muốn bình luận giả sử rằng thử nghiệm dựa trên mô hình hồi quy hoặc sự kiện giả định rằng chúng ta đã có thời gian để dữ liệu sự kiện phù hợp với mô hình hồi quy Cox, hãy bình luận. Tôi rất thích nghe những hiểu biết của bạn. Câu hỏi của tôi được giải quyết cho vấn đề chung và không chỉ là ví dụ cụ thể.
Michael R. Chernick

Ý tôi là, thử nghiệm so sánh hiệu ứng (nhóm) chính được điều chỉnh cho hiệp phương sai, hay không điều chỉnh? Nếu không được điều chỉnh, thì có thể hữu ích khi cung cấp cho chúng tôi bảng 2 × 2 hoặc bảng tương tự để tập trung ý tưởng.
vào

Không điều chỉnh cho các thử nghiệm đặc biệt này.
Michael R. Chernick

Câu trả lời:


7

Chà, từ những gì bạn đã nói, tôi nghĩ bạn đã che đậy phần lớn nhưng chỉ cần đặt nó vào ngôn ngữ của cô ấy: Một là sự khác biệt của rủi ro, một là tỷ lệ. Vì vậy, một thử nghiệm giả thuyết hỏi nếu trong khi cái còn lại hỏi nếu p 2p2p1=0. Đôi khi những điều này là "gần gũi" đôi khi không. (Đóng trong dấu ngoặc kép vì rõ ràng chúng không đóng theo nghĩa số học thông thường). Nếu rủi ro là hiếm, chúng thường "cách xa nhau". ví dụ:0,002/.001=2(cách xa 1) trong khip2p1=1.002/.001=2 (gần bằng 0); nhưng nếu rủi ro cao, thì đây là "gần": .2 / .1 = 2 (cách xa 0) và .2 - .1 = .1 (cũng cách xa 0, ít nhất là so với trường hợp hiếm gặp..002.001=.001.2/.1=2.2.1=.1


2
Bạn có một trong những ý tưởng của tôi trong đó, khi số lượng nhỏ, thường gặp trong nghiên cứu tỷ lệ mắc thấp, sự khác biệt trông nhỏ nhưng tỷ lệ vẫn trông lớn. Ví dụ số của bạn rất hấp dẫn. Tôi muốn thêm một cái gì đó về sự ổn định của các ước tính theo giả thuyết null. Đối với một số điều này có thể là quá kỹ thuật nhưng ở mức độ tinh tế của cô có thể không. Giả sử hai quần thể có phân phối danh nghĩa có nghĩa là không và phương sai chung đã biết. Sau đó, sự khác biệt được chuẩn hóa là N (0,1) theo giả thuyết null đưa ra một thống kê kiểm tra rất ổn định.
Michael R. Chernick

1
Nhưng theo các giả định này, tỷ lệ này có phân phối Cauchy và có thể rất lớn. Có thể lập luận này cần sửa đổi vì tỷ lệ mới mắc phải dương và có thể phân phối rất sai lệch. Tôi đoán những gì tôi muốn là một ví dụ cho thấy sự khác biệt có phân phối rất ổn định và tỷ lệ không đặc biệt vì kích thước mẫu nhỏ và mẫu số có thể rất gần với 0. Có ai có ví dụ minh họa tốt không?
Michael R. Chernick

@ Peter Ý của bạn là để viết ba không phải là hai? Nếu vậy bạn có thể xác định ký hiệu của bạn? pi
vào

Tôi nghĩ rằng anh ấy có nghĩa là p1 khi anh ấy viết p0. Chỉ là một lỗi cơ bản. Có ba ps trong bối cảnh này không có ý nghĩa.
Michael R. Chernick

1
Tôi đã thực hiện thay đổi cho Peter. Hét vào mặt tôi nếu tôi làm điều gì sai!
Michael R. Chernick

6

Lưu ý rằng trong cả hai bài kiểm tra, bạn kiểm tra một giả thuyết hoàn toàn khác với các giả định khác nhau. Kết quả không thể so sánh được, và đó là một sai lầm quá phổ biến.

Trong rủi ro tuyệt đối, bạn kiểm tra xem chênh lệch (trung bình) về tỷ lệ có khác biệt đáng kể so với không. Giả thuyết cơ bản trong thử nghiệm tiêu chuẩn cho giả định này cho rằng sự khác biệt về tỷ lệ thường được phân phối. Điều này có thể giữ cho tỷ lệ nhỏ, nhưng không phải cho lớn. Về mặt kỹ thuật bạn tính xác suất có điều kiện sau:

P(p1p2=0|X)

với p 2 hai tỷ lệ và X biến giải thích của bạn. Điều này tương đương với việc kiểm tra độ dốc b của mô hình sau:p1p2Xb

p=a+bX+ϵ

nơi bạn cho rằng ϵN(0,σ)

X

P(log(p1p2)=0|X)

tương đương với việc kiểm tra độ dốc trong mô hình logistic sau:

log(p1p)=a+bX+ϵ

với log(p1p)

Lý do tại sao điều này tạo ra sự khác biệt được đưa ra trong câu trả lời của Peter Flom: một sự khác biệt nhỏ trong rủi ro tuyệt đối có thể dẫn đến một giá trị lớn cho tỷ lệ cược. Vì vậy, trong trường hợp của bạn, điều đó có nghĩa là tỷ lệ người mắc bệnh không khác nhau đáng kể, nhưng tỷ lệ mắc bệnh ở một nhóm lớn hơn đáng kể so với tỷ lệ mắc bệnh ở nhóm kia. Điều đó là hoàn toàn hợp lý.


1
Tôi nghĩ rằng tất cả chúng ta đều đồng ý rằng lý do chính của vấn đề là sự khác biệt nhỏ về rủi ro tuyệt đối có thể dẫn đến sự khác biệt lớn về rủi ro tương đối. Sau khi tất cả .2 đến.1 có rủi ro tương đối giống như 0,0002 đến 0,0001. Tôi nghĩ rằng đây là thông điệp chúng ta có thể mang về nhà cho giáo dân. Lời giải thích của bạn rất hay cho các nhà thống kê nhưng tôi không chắc rằng nó sẽ dễ hiểu bởi một giáo dân và người ta có thể nói "Vậy nếu bạn đang thử nghiệm một giả thuyết khác.
Michael R. Chernick

Bạn vẫn đang cố gắng xác định mức giá có khác nhau hay không. Vì vậy, mặc dù các giả thuyết là khác nhau, kết quả phải nhất quán. Sau khi tất cả p1-p2 = 0 giống với p1 / p2 = 1. "Vì vậy, tôi nghĩ rằng thực tế là các giả thuyết khác nhau đã bỏ lỡ điểm và không phải là một lời giải thích thỏa đáng.
Michael R. Chernick

@MichaelCécick Tôi sắp nói rằng sự khác biệt về tỷ lệ là có điều kiện, và tỷ lệ chênh lệch thì không. Nhưng đó không phải là trường hợp, cả hai đều cho kết quả chính xác như nhau sau khi hoán chuyển bảng (trong trường hợp bảng 2X2). Tôi đã chạy một số mô phỏng, nhưng tôi không thể ép các giá trị p của prop.test(hoặc chisq.testvì nó tương đương trong trường hợp 2x2) và fisher.testcách nhau hơn 0,005. Vì vậy, tôi tự hỏi những thử nghiệm mà cô ấy đã sử dụng ...
Joris Meys

Nó sẽ là chi vuông hoặc thử nghiệm của Fisher. Rất có thể là thử nghiệm của Fisher bởi vì cô ấy biết trong các mẫu nhỏ rằng phép tính gần đúng chi bình phương là không tốt. Khi tôi làm số liệu thống kê cho họ, tôi sử dụng SAS. Cô ấy đã làm công việc của mình bằng STATA. Tôi có thể có thể đào lên bảng thực tế.
Michael R. Chernick

2
log(p1p0)=log(p1)log(p0)p1p0
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.