Là sự nhạy cảm hoặc tính đặc hiệu là một chức năng của sự phổ biến?


10

Dạy học tiêu chuẩn nói rằng độ nhạy và độ đặc hiệu là thuộc tính của bài kiểm tra và không phụ thuộc vào mức độ phổ biến. Nhưng đây không chỉ là một giả định sao?

Nguyên tắc nội khoa của Harrison 19 ed nói

Từ lâu, người ta đã khẳng định rằng độ nhạy và độ đặc hiệu là các thông số độc lập phổ biến về độ chính xác kiểm tra và nhiều văn bản vẫn đưa ra tuyên bố này. Giả định hữu ích thống kê này, tuy nhiên, là đơn giản lâm sàng. ... Độ nhạy kiểm tra có thể sẽ cao hơn ở bệnh nhân nhập viện và độ đặc hiệu xét nghiệm cao hơn ở bệnh nhân ngoại trú.

(Tỷ lệ mắc bệnh thường cao hơn ở bệnh nhân nội trú so với bệnh nhân ngoại trú)

Có một mối quan hệ toán học hoặc đồ họa gần đúng giữa các tham số này?

Ngay cả liên kết này cũng gọi đó là "đơn giản hóa". Tại sao?

Chỉnh sửa: Tôi biết độ nhạy được xác định. Không có thuật ngữ về tỷ lệ lưu hành liên quan, như đã đề cập trong các câu trả lời. Bản thân tôi đã duy trì rằng đây là những tính chất của bài kiểm tra không bị ảnh hưởng bởi dân số được sử dụng, cho đến khi tôi bắt gặp tuyên bố này, do đó câu hỏi. Nhưng tôi cho rằng, sự nhầm lẫn này phát sinh không phải do định nghĩa mà là tính toán thực tế của các giá trị này. Độ đặc hiệu và độ nhạy được tính bằng các bảng 2x2, mức độ phổ biến của dân số tham chiếu ở đây có quan trọng không? Có phải đó là những gì họ đang đề cập đến? Nếu có, chức năng là gì?

Câu trả lời:


4

Mặc dù câu trả lời của @ Tim ♦ và @ gung ♦ bao gồm khá nhiều thứ, tôi sẽ cố gắng tổng hợp cả hai thành một và cung cấp thêm thông tin làm rõ.

Bối cảnh của các dòng trích dẫn có thể chủ yếu đề cập đến các xét nghiệm lâm sàng dưới dạng Ngưỡng nhất định, như là phổ biến nhất. Hãy tưởng tượng một bệnh và mọi thứ ngoài bao gồm cả trạng thái khỏe mạnh được gọi là . Đối với thử nghiệm của chúng tôi, chúng tôi muốn tìm một số phép đo proxy cho phép chúng tôi có được dự đoán tốt cho (1) Lý do chúng tôi không có được độ đặc hiệu / độ nhạy tuyệt đối là các giá trị về số lượng proxy của chúng tôi không hoàn toàn tương quan với tình trạng bệnh nhưng thường chỉ liên quan đến nó, và do đó, trong các phép đo riêng lẻ, chúng ta có thể có cơ hội số lượng đó vượt qua ngưỡng của chúng tôi choD D c D D c cDDDcDDccá nhân và ngược lại. Để rõ ràng, hãy giả sử Mô hình Gaussian cho tính biến đổi.

Giả sử chúng tôi đang sử dụng làm số lượng proxy. Nếu được chọn độc đáo, thì phải cao hơn ( là toán tử giá trị mong đợi). Bây giờ vấn đề phát sinh khi chúng tôi nhận ra rằng là một tình huống tổng hợp ( ), thực sự được tạo thành từ 3 cấp độ nghiêm trọng , , , mỗi loại có giá trị kỳ vọng tăng dần cho . Đối với một cá nhân, được chọn từ danh mục hoặc từx E [ x D ] E [xxE[xD]E D D c D 1 D 2 D 3 x D D c x T D D c x T D x D cE[xDc]EDDcD1D2D3xDDcloại, xác suất của 'thử nghiệm' có tích cực hay không sẽ phụ thuộc vào giá trị ngưỡng chúng tôi chọn. Giả sử chúng tôi chọn dựa trên việc nghiên cứu một mẫu thực sự ngẫu nhiên có cả cá nhân và . của chúng tôi sẽ gây ra một số tích cực và tiêu cực sai. Nếu chúng ta chọn ngẫu nhiên một người , xác suất chi phối giá trị của anh ta / cô ta nếu được đưa ra bởi biểu đồ màu xanh lá cây và của người được chọn ngẫu nhiên bằng biểu đồ màu đỏ.xTDDcxTDxDcnhập mô tả hình ảnh ở đây

Con số thực tế thu được sẽ phụ thuộc vào số lượng thực tế của các cá nhân và nhưng độ đặc hiệu và độ nhạy kết quả sẽ không. Đặt là hàm xác suất tích lũy. Sau đó, về mức độ phổ biến của của bệnh , đây là bảng 2x2 như mong đợi của trường hợp chung, khi chúng ta cố gắng thực sự xem xét nghiệm của mình thực hiện như thế nào trong dân số kết hợp.D c F ( ) p DDDcF()pD

( D c , - ) = ( 1 - p ) ( 1 - F D c ( x T ) ) ( D , - ) = p ( F D ( x T ) ) ( D c , + )

(D,+)=p(1FD(xT))
(Dc,)=(1p)(1FDc(xT))
(D,)=p(FD(xT))
(Dc,+)=(1p)FDc(xT)

Các số thực tế phụ thuộc , nhưng độ nhạy và độ đặc hiệu là độc lập. Nhưng, cả hai đều phụ thuộc vào và . Do đó, tất cả các yếu tố ảnh hưởng đến những điều này, chắc chắn sẽ thay đổi các số liệu này. Ví dụ, nếu chúng ta làm việc trong ICU, của chúng ta sẽ được thay thế bằng và nếu chúng ta đang nói về bệnh nhân ngoại trú, được thay thế bằng . Đó là một vấn đề riêng mà trong bệnh viện, tỷ lệ lưu hành cũng khác nhau,p F D F D c F D F D 3 F D 1 D c D c x D D C F D F D C D F FppFDFDcFDFD3FD1nhưng nó không phải là tỷ lệ phổ biến khác nhau gây ra sự nhạy cảm và đặc hiệu khác nhau, mà là sự phân phối khác nhau, vì mô hình mà ngưỡng được xác định không áp dụng cho dân số xuất hiện dưới dạng bệnh nhân ngoại trú hoặc bệnh nhân nội trú . Bạn có thể tiếp tục và phá vỡ trong nhiều quần thể, vì phần phụ của bệnh nhân nội trú của cũng sẽ tăng do các lý do khác (vì hầu hết các proxy cũng được 'nâng cao' trong các điều kiện nghiêm trọng khác). Việc chia dân số thành dân số giải thích sự thay đổi độ nhạy cảm, trong khi dân số giải thích sự thay đổi về tính đặc hiệu (bằng những thay đổi tương ứng trong vàDcDcxDDcFDFDc ). Đây là những gì đồ thị tổng hợp thực sự bao gồm. Mỗi màu thực sự sẽ có riêng , và do đó, miễn là màu này khác với mà độ nhạy và độ đặc hiệu ban đầu được tính, các số liệu này sẽ thay đổi.DFF

nhập mô tả hình ảnh ở đây

Thí dụ

Giả sử dân số 11550 với 10000 Dc, 500.750.300 D1, D2, D3 tương ứng. Phần nhận xét là mã được sử dụng cho các biểu đồ trên.

set.seed(12345)
dc<-rnorm(10000,mean = 9, sd = 3)
d1<-rnorm(500,mean = 15,sd=2)
d2<-rnorm(750,mean=17,sd=2)
d3<-rnorm(300,mean=20,sd=2)
d<-cbind(c(d1,d2,d3),c(rep('1',500),rep('2',750),rep('3',300)))
library(ggplot2)
#ggplot(data.frame(dc))+geom_density(aes(x=dc),alpha=0.5,fill='green')+geom_density(data=data.frame(c(d1,d2,d3)),aes(x=c(d1,d2,d3)),alpha=0.5, fill='red')+geom_vline(xintercept = 13.5,color='black',size=2)+scale_x_continuous(name='Values for x',breaks=c(mean(dc),mean(as.numeric(d[,1])),13.5),labels=c('x_dc','x_d','x_T'))

#ggplot(data.frame(d))+geom_density(aes(x=as.numeric(d[,1]),..count..,fill=d[,2]),position='stack',alpha=0.5)+xlab('x-values')

Chúng ta có thể dễ dàng tính toán phương tiện x cho các quần thể khác nhau, bao gồm Dc, D1, D2, D3 và hỗn hợp D.

mean(dc) 
mean(d1) 
mean(d2) 
mean(d3) 
mean(as.numeric(d[,1]))

> mean(dc) [1] 8.997931
> mean(d1) [1] 14.95559
> mean(d2) [1] 17.01523
> mean(d3) [1] 19.76903
> mean(as.numeric(d[,1])) [1] 16.88382

Để có được bảng 2x2 cho trường hợp Thử nghiệm ban đầu của chúng tôi, trước tiên chúng tôi đặt ngưỡng, dựa trên dữ liệu (trong trường hợp thực sẽ được đặt sau khi chạy thử nghiệm như @gung hiển thị). Dù sao, giả sử ngưỡng 13,5, chúng ta có được độ nhạy và độ đặc hiệu sau khi tính toán trên toàn bộ dân số.

sdc<-sample(dc,0.1*length(dc)) 
sdcomposite<-sample(c(d1,d2,d3),0.1*length(c(d1,d2,d3))) 
threshold<-13.5 
truepositive<-sum(sdcomposite>13.5) 
truenegative<-sum(sdc<=13.5) 
falsepositive<-sum(sdc>13.5) 
falsenegative<-sum(sdcomposite<=13.5) 
print(c(truepositive,truenegative,falsepositive,falsenegative)) 
sensitivity<-truepositive/length(sdcomposite) 
specificity<-truenegative/length(sdc) 
print(c(sensitivity,specificity))

> print(c(truepositive,truenegative,falsepositive,falsenegative)) [1]139 928  72  16
> print(c(sensitivity,specificity)) [1] 0.8967742 0.9280000

Giả sử chúng tôi đang làm việc với bệnh nhân ngoại trú và chúng tôi chỉ nhận bệnh nhân mắc bệnh từ tỷ lệ D1 hoặc chúng tôi đang làm việc tại ICU nơi chúng tôi chỉ nhận được D3. (đối với trường hợp tổng quát hơn, chúng ta cũng cần chia thành phần Dc) Độ nhạy và độ đặc hiệu của chúng ta thay đổi như thế nào? Bằng cách thay đổi tỷ lệ lưu hành (tức là bằng cách thay đổi tỷ lệ tương đối của bệnh nhân thuộc một trong hai trường hợp, chúng tôi không thay đổi độ đặc hiệu và độ nhạy cảm.

sdc<-sample(dc,0.1*length(dc)) 
sd1<-sample(d1,0.1*length(d1)) 
truepositive<-sum(sd1>13.5) 
truenegative<-sum(sdc<=13.5) 
falsepositive<-sum(sdc>13.5) 
falsenegative<-sum(sd1<=13.5) 
print(c(truepositive,truenegative,falsepositive,falsenegative)) 
sensitivity1<-truepositive/length(sd1) 
specificity1<-truenegative/length(sdc) 
print(c(sensitivity1,specificity1)) 
sdc<-sample(dc,0.1*length(dc)) 
sd3<-sample(d3,0.1*length(d3)) 
truepositive<-sum(sd3>13.5) 
truenegative<-sum(sdc<=13.5) 
falsepositive<-sum(sdc>13.5) 
falsenegative<-sum(sd3<=13.5) 
print(c(truepositive,truenegative,falsepositive,falsenegative)) 
sensitivity3<-truepositive/length(sd3) 
specificity3<-truenegative/length(sdc) 
print(c(sensitivity3,specificity3))

> print(c(truepositive,truenegative,falsepositive,falsenegative)) [1]  38 931  69  12
> print(c(sensitivity1,specificity1)) [1] 0.760 0.931
> print(c(truepositive,truenegative,falsepositive,falsenegative)) [1]  30 944  56   0
> print(c(sensitivity3,specificity3)) [1] 1.000 0.944

Tóm lại, một âm mưu cho thấy sự thay đổi độ nhạy (độ đặc hiệu sẽ theo xu hướng tương tự, chúng tôi cũng đã tạo ra dân số Dc từ các quần thể) với trung bình x khác nhau cho dân số, đây là một biểu đồ

df<-data.frame(V1=c(sensitivity,sensitivity1,sensitivity3),V2=c(mean(c(d1,d2,d3)),mean(d1),mean(d3))) 
ggplot(df)+geom_point(aes(x=V2,y=V1),size=2)+geom_line(aes(x=V2,y=V1))

nhập mô tả hình ảnh ở đây

  1. D

9

Đầu tiên, đáng để nhận ra rằng bạn thường không thể thay đổi độ nhạy độc lập với độ đặc hiệu và ngược lại. Đây là điểm của đường cong ROC. Do tính chất của quá trình tạo dữ liệu và mô hình và dữ liệu cụ thể của bạn, bạn sẽ luôn bị mắc kẹt với một số sự đánh đổi giữa độ nhạy và độ đặc hiệu. Tất nhiên bạn muốn có độ nhạy 100% và độ đặc hiệu 100% cùng một lúc, nhưng thông thường bạn không thể. Bạn có thể có được độ nhạy tốt hơn, nhưng với chi phí cho độ đặc hiệu kém hơn, hoặc độ đặc hiệu tốt hơn, nhưng với chi phí cho độ nhạy kém nhất. Đường cong ROC cho bạn thấy tập hợp các sự cân bằng mà bạn buộc phải chọn giữa. (Một vài lưu ý: 1. đôi khi bạn có thể đạt được một chiều mà không mất bất kỳ thứ gì trên mặt kia vì có một khoảng trống trong tập dữ liệu của bạn, nhưng điều này chủ yếu là ảo tưởng; 2.Đường cong ROC là độ nhạy như là một hàm của độ đặc hiệu 1, biểu đồ độ nhạy so với độ đặc hiệu sẽ là đường cong ROC được phản ánh.)

nhập mô tả hình ảnh ở đây

Ở mức độ nào, làm thế nào độ nhạy và độ đặc hiệu rõ ràng có thể thay đổi theo tỷ lệ hiện mắc? Đây là một vấn đề trong đó nó giúp mô phỏng và chơi với một số dữ liệu để xem làm thế nào điều này có thể giải quyết trong thực tế. Chúng ta hãy tưởng tượng rằng một mô hình phù hợp với một tập dữ liệu khá lớn có tỷ lệ phổ biến cụ thể và một ngưỡng được đặt trên trục x 1 . Sau đó, hiệu suất của thử nghiệm này được tính toán với các mẫu có tỷ lệ phổ biến khác nhau (và do đó, các giá trị x khác nhau). Kết quả là cùng một mô hình, sử dụng cùng một ngưỡng sẽ thực hiện khác nhau khi được áp dụng cho các bộ dữ liệu có mức độ phổ biến khác nhau.

library(caret)  # we'll use these packages
library(binom)
  # we'll use this function to convert log odds to probabilities
lo2p = function(lo){ exp(lo)/(1+exp(lo)) }

##### training dataset for original model
set.seed(734)                     # these make the examples exactly reproducible
Nt = 1000
xt = rnorm(Nt, mean=5, sd=1)      # this is the distribution of X
lo = -1.386 + .308*xt             # this is the data generating process
pt = lo2p(lo)
yt = rbinom(Nt, size=1, prob=pt)
mt = glm(yt~xt, family=binomial)
summary(mt)
# ...
# Coefficients:
#             Estimate Std. Error z value Pr(>|z|)    
# (Intercept) -1.16736    0.32794  -3.560 0.000371 ***
# xt           0.24980    0.06429   3.886 0.000102 ***
# ...
#     Null deviance: 1384.5  on 999  degrees of freedom
# Residual deviance: 1369.1  on 998  degrees of freedom
# AIC: 1373.1

## determine threshold
# prob(Y) = 50%, where log odds = 0, so:
-coef(mt)[1]/coef(mt)[2]  # 4.673159
threshold = 4.7  # a simple round number
classt    = ifelse(xt>threshold, 1, 0)
tabt      = table(classt, yt)[2:1,2:1]

confusionMatrix(tabt)
#       yt
# classt   1   0
#      1 346 279
#      0 175 200
#                                           
#                Accuracy : 0.546           
#                     ...                                          
#             Sensitivity : 0.6641          
#             Specificity : 0.4175          
#          Pos Pred Value : 0.5536          
#          Neg Pred Value : 0.5333          
#              Prevalence : 0.5210          


##### high prevalence dataset from hospital
set.seed(4528)
Nh = 500
xh = rnorm(Nh, mean=6, sd=1)  # a different distribution of X
lo = -1.386 + .308*xh         # but the same data generating process
ph = lo2p(lo)
yh = rbinom(Nh, size=1, prob=ph)
classh = ifelse(xh>threshold, 1, 0)  # the same threshold is used
tabh   = table(classh, yh)[2:1,2:1]

confusionMatrix(tabh)
#       yh
# classh   1   0
#      1 284 163
#      0  20  33
#                                           
#                Accuracy : 0.634           
#                     ...
#             Sensitivity : 0.9342          
#             Specificity : 0.1684          
#          Pos Pred Value : 0.6353          
#          Neg Pred Value : 0.6226          
#              Prevalence : 0.6080          


##### low prevalence dataset from outpatients
set.seed(1027)
Nl = 500
xl = rnorm(Nl, mean=3, sd=1)
lo = -1.386 + .308*xl
pl = lo2p(lo)
yl = rbinom(Nl, size=1, prob=pl)
classl = ifelse(xl>threshold, 1, 0)
tabl   = table(classl, yl)[2:1,2:1]

confusionMatrix(tabl)
#       yl
# classl   1   0
#      1   9  14
#      0 190 287
#                                           
#                Accuracy : 0.592           
#                     ...
#             Sensitivity : 0.04523         
#             Specificity : 0.95349         
#          Pos Pred Value : 0.39130         
#          Neg Pred Value : 0.60168         
#              Prevalence : 0.39800         


##### sensitivities
binom.confint(346, 521, method="e")
#   method   x   n      mean     lower    upper
# 1  exact 346 521 0.6641075 0.6217484 0.704592
binom.confint(284, 304, method="e")
#   method   x   n      mean   lower     upper
# 1  exact 284 304 0.9342105 0.90022 0.9593543
binom.confint(  9, 199, method="e")
#   method x   n       mean      lower      upper
# 1  exact 9 199 0.04522613 0.02088589 0.08411464

##### specificities
binom.confint(200, 479, method="e")
#   method   x   n      mean     lower     upper
# 1  exact 200 479 0.4175365 0.3729575 0.4631398
binom.confint( 33, 196, method="e")
#   method  x   n      mean     lower     upper
# 1  exact 33 196 0.1683673 0.1188206 0.2282441
binom.confint(287, 301, method="e")
#   method   x   n      mean     lower     upper
# 1  exact 287 301 0.9534884 0.9231921 0.9743417

Dưới đây là độ nhạy và độ đặc hiệu như là một hàm của tỷ lệ phổ biến, với khoảng tin cậy chính xác 95%:

nhập mô tả hình ảnh ở đây

Vậy chuyện gì đang xảy ra ở đây? Hãy xem xét rằng một hồi quy logistic nguyên mẫu có thể trông giống như hình dưới đây. Lưu ý rằng tất cả các 'hành động' đang diễn ra trong khoảng [4, 6] trên trục x. Dữ liệu dưới đây sẽ có tỷ lệ lưu hành rất thấp và mô hình sẽ cho thấy sự phân biệt đối xử và độ nhạy kém. Dữ liệu trên khoảng đó sẽ có tỷ lệ lưu hành rất cao, nhưng mô hình sẽ lại không phân biệt tốt và sẽ có tính đặc hiệu kém.

nhập mô tả hình ảnh ở đây

Để giúp hiểu làm thế nào điều này có thể xảy ra, hãy xem xét xét nghiệm Alanine transaminase để xác định xem gan của bệnh nhân có bị hỏng không 2. Ý tưởng là gan thường sử dụng ALT, nhưng nếu gan ngừng hoạt động thì ALT sẽ bị đổ vào dòng máu. Vì vậy, nếu mức ALT trong máu của bệnh nhân vượt quá ngưỡng nào đó, điều đó có nghĩa là gan bị suy. Nếu bạn vẽ một mẫu có tỷ lệ suy gan cao, bạn sẽ vẽ một mẫu có hàm lượng ALT cao trong máu. Như vậy, bạn sẽ có nhiều bệnh nhân hơn ngưỡng. Không phải ai bị ALT trong máu cũng sẽ bị suy gan, đối với một số bệnh nhân sẽ có một số nguyên nhân khác. Nhưng những người bị suy gan nên bị bắt. Điều này dẫn đến độ nhạy cao hơn. Tương tự như vậy, không phải tất cả bệnh nhân có mức ALT bình thường đều có gan khỏe mạnh, nhưng một mẫu có tỷ lệ lưu hành thấp sẽ có mức ALT thấp hơn và nhiều bệnh nhân sẽ vượt qua bài kiểm tra. Những người có gan phát sinh ' T thất bại, nhưng những người có mức ALT bình thường sẽ bị bỏ qua. Điều này dẫn đến độ nhạy thấp hơn, nhưng độ đặc hiệu cao hơn.

Tổng quát hơn, toàn bộ ý tưởng của xét nghiệm y tế là thứ gì đó hay thứ khác có liên quan đến tình trạng bệnh mà bạn có thể muốn có các biện pháp trực tiếp, nhưng không thể. Lấy thước đo tương quan cho bạn cái nhìn sâu sắc về tình trạng bệnh. Một thử nghiệm (tiềm năng) trong đó điều này không đúng sẽ không có giá trị và sẽ không được sử dụng. Do đó, trong thực tế, các mẫu có tỷ lệ lưu hành cao hơn nên có sự phân bố tương quan với các giá trị bất thường hơn dẫn đến độ nhạy cao hơn và ngược lại. (Lưu ý rằng mối tương quan không phải là nguyên nhân gây bệnh; trong ví dụ ALT, đó là một hiệu ứng, trong các ví dụ khác, cả bệnh và tương quan đều có thể là tác động của nguyên nhân chung, v.v.)

1. Điều này thực sự khá phổ biến trong y học. Hãy xem xét rằng cholesterol nên <200, huyết áp tâm thu phải <140, v.v. Những người đó không thực sự là 'xét nghiệm' mỗi lần, nhưng có rất nhiều xét nghiệm hoạt động giống như vậy. Đối với một số cuộc thảo luận liên quan (có lẽ ở xa) về ngưỡng, có thể giúp đọc câu trả lời của tôi về ngưỡng 0-1 luôn luôn tương đương với ngưỡng trục x? Tại sao số lượng dương tính giả không phụ thuộc vào kích thước mẫu, nếu chúng ta sử dụng giá trị p để so sánh hai bộ dữ liệu độc lập?
2. Xin lưu ý rằng tôi không phải là bác sĩ và ví dụ này có thể bị hỏng nặng. Hỏi bác sĩ thực tế nếu bạn muốn thông tin chính xác về chức năng gan, xét nghiệm và các vấn đề liên quan.


Cảm ơn! Để cho thấy rằng nó thực sự thay đổi. Nhưng làm thế nào để xem xét câu trả lời của @Tim? Có phải nó mâu thuẫn không?
Polisetty

1
@Polisetty, Tim nói rằng, "bệnh nhân nội trú và bệnh nhân ngoại trú có thể khác nhau về nhiều mặt, không chỉ riêng về tỷ lệ lưu hành, vì vậy một số yếu tố khác có thể ảnh hưởng đến độ nhạy cảm". Nếu xét nghiệm là chức năng của một số tài sản của bệnh nhân (giả sử là cholesterol), và bệnh cũng có mối tương quan chặt chẽ với tài sản đó (nói chung là toàn bộ vấn đề), thì "các yếu tố khác" phải di chuyển cùng với tỷ lệ. Do đó, khi tỷ lệ lưu hành thay đổi, các mối tương quan khác thay đổi, và xét nghiệm có độ nhạy ít nhiều với nhóm cụ thể đó.
gung - Phục hồi Monica

7

Như đã nói bởi những người khác, độ nhạy và độ đặc hiệu không phụ thuộc vào mức độ phổ biến. Độ nhạy là tỷ lệ dương tính thật trong số tất cả các dương tính và độ đặc hiệu là tỷ lệ âm tính thực sự trong số tất cả các âm tính. Vì vậy, nếu độ nhạy là 90%, thì xét nghiệm sẽ chính xác cho 90% trường hợp dương tính. Rõ ràng 90% của một cái gì đó nhỏ hơn và 90% của một cái gì đó lớn hơn vẫn là 90% ...

Vì vậy, đưa ra các dữ liệu bảng mà bạn đề cập,

positiveconditionnegativeconditionpositivetestacnegativetestbd

aa+b+c+d/a+ba+b+c+d=aa+b p(YX)=p(YX)p(X)da+b+c+d/c+da+b+c+d=dc+d

Nhưng trích dẫn dường như cũng đang nói điều gì đó khác

độ nhạy kiểm tra có thể sẽ cao hơn ở bệnh nhân nhập viện và độ đặc hiệu của xét nghiệm cao hơn ở bệnh nhân ngoại trú

vì vậy các tác giả nói rằng độ nhạy khác nhau trong các nhóm khác nhau. Tôi đoán rằng bệnh nhân nội trú và bệnh nhân ngoại trú có thể khác nhau về nhiều mặt, không chỉ riêng về tỷ lệ lưu hành, vì vậy một số yếu tố khác có thể ảnh hưởng đến độ nhạy cảm. Vì vậy, tôi đồng ý rằng chúng có thể thay đổi giữa các bộ dữ liệu khác nhau, khác nhau về mức độ phổ biến, nhưng thay đổi sẽ không phải là một chức năng của tỷ lệ lưu hành (như được thể hiện bởi @gung trong câu trả lời của anh ấy).

p(positive testcondition)

p(conditionpositive test)p(positive testcondition)×p(condition)

và trong nhiều trường hợp, đây là xác suất mà mọi người quan tâm ("khả năng bệnh nhân có kết quả xét nghiệm dương tính thực sự mắc bệnh như thế nào?") và nó phụ thuộc vào tỷ lệ lưu hành. Lưu ý rằng liên kết của bạn cũng thảo luận về tác động của tỷ lệ lưu hành đối với Giá trị Dự đoán Tích cực, nghĩa là xác suất sau, không phải về độ nhạy.


Như tôi đã đề cập trong một trong những câu trả lời trước đó, tôi khá chắc chắn rằng các authours không nhầm lẫn nó với xác suất sau, vì họ đề cập rõ ràng rằng "nhiều văn bản vẫn đưa ra tuyên bố này". Và tôi cũng trích dẫn một nguồn khác, althoguh không đáng tin cậy như của Harrison, nói rằng đó là một 'giả định' an toàn. Tất cả những gì tôi muốn hỏi là, 'giả định' là gì?
Polisetty

2
@Polisetty Tôi không thể nói cho các tác giả, nhưng từ trích dẫn, họ dường như gọi sự độc lập về sự phổ biến là "giả định", nhưng đây là một thực tế toán học sau đó là giả định. Nếu nó không giữ, điều đó có nghĩa là lý thuyết xác suất bị phá vỡ và điều đó không xảy ra.
Tim

Độ nhạy và độ đặc hiệu có thể được coi là thuộc tính cố định của xét nghiệm chẩn đoán. [Đây là một sự đơn giản hóa nhỏ, nhưng nó đủ tốt cho mục đích của chúng tôi]. - đó là những gì nó nói
Polisetty

3

Xem câu trả lời của tôi ở đây về tỷ lệ dương / âm đúng / sai.

Độ nhạy chỉ là một tên gọi khác của tỷ lệ dương thực sự, và độ đặc hiệu giống như tỷ lệ âm thực sự. Cả độ nhạy và độ đặc hiệu là xác suất có điều kiện; họ điều kiện về tình trạng bệnh của bệnh nhân. Do đó, tỷ lệ mắc bệnh (nghĩa là xác suất tiên nghiệm mà bệnh nhân mắc bệnh) là không liên quan, vì bạn đang giả sử một tình trạng bệnh cụ thể.

Tôi không thể nhận xét tại sao tác giả sách giáo khoa tuyên bố rằng độ nhạy và độ đặc hiệu phụ thuộc vào bối cảnh lâm sàng. Là những quan sát thực nghiệm?


Chính xác. Do đó câu hỏi. Độ nhạy của xét nghiệm phụ thuộc vào dân số nơi sử dụng. Giả định rằng nó độc lập không phải lúc nào cũng đúng. Tôi đang hỏi làm thế nào và tại sao. Cuốn sách sau đó cũng trích dẫn các giá trị
Polisetty

Có thể có các yếu tố dân số cụ thể ảnh hưởng đến độ nhạy và độ đặc hiệu. Nhưng nó xuất phát từ các định nghĩa toán học về độ nhạy và độ đặc hiệu mà tỷ lệ lưu hành có thể là một trong những yếu tố này, ít nhất là không trực tiếp. (Nhân tiện, vui lòng chấp nhận câu trả lời của tôi nếu bạn hài lòng với lời giải thích của tôi về các định nghĩa toán học.)
tddevlin

Xin lỗi, tôi đoán nó không rõ ràng. Tôi muốn biết mối quan hệ giữa độ nhạy và tỷ lệ phổ biến về mặt toán học. Tôi biết làm thế nào chúng được định nghĩa. Tôi đoán mối quan hệ đến vì cách họ được tính toán. Độ nhạy là tp / (tp + fn) trong khi tỷ lệ lưu hành là tp + fn / (tp + fn + fp + tn)
Polisetty 14/2/18

P(Disease)P(+|disease)

Harrison sẽ không hiểu sai. Ngay cả liên kết này gọi nó là một đơn giản hóa. med.uottawa.ca/sim/data/Sens nhạy_and_Prevalence_e.htm
Polisetty

1

Tất nhiên, tôi không thể nói ra ý định của tác giả, nhưng đây sẽ là lý do của tôi cho tuyên bố đó:

Xem xét bối cảnh lâm sàng như một xét nghiệm chẩn đoán chính nó. Một với độ nhạy và độ đặc hiệu rất kém, nhưng một bài kiểm tra không kém. Nếu bạn đang ở trong bệnh viện, bạn có khả năng bị bệnh. Nếu bạn không ở trong bệnh viện, bạn không có khả năng bị bệnh.

Từ quan điểm này, xét nghiệm chẩn đoán thực tế bạn thực hiện là phần thứ hai của hai xét nghiệm được thực hiện nối tiếp.


Trong lời giải thích của bạn, các tiên nghiệm đang thay đổi dẫn đến xác suất sau lớn hơn. Điều đó đúng. Nhưng làm thế nào để nhạy cảm tự thay đổi là câu hỏi.
Polisetty

@Polisetty Điều gì sẽ xảy ra nếu bạn gọi một bài kiểm tra tích cực cao? "Bối cảnh lâm sàng tự nó là một thử nghiệm." Tôi nghĩ rằng bất kỳ thử nghiệm quyết định tùy ý có thể được thực hiện để phụ thuộc vào mức độ phổ biến theo cách này, vì vậy "thử nghiệm" phải được xác định cụ thể hơn. Tôi nghĩ rằng tuyên bố áp dụng cho nhiều thử nghiệm thông thường dựa trên ngưỡng của một số phép đo proxy.
Satwik Pasani

1

Đây phải là một sai lầm. Tôi nghĩ có lẽ tác giả đang cố gắng đề xuất rằng giá trị tiên đoán tích cực và tiêu cực (PPV và NPV) phụ thuộc vào mức độ phổ biến (cũng như độ nhạy và độ đặc hiệu). Chúng thường được thảo luận với các xét nghiệm chẩn đoán và, đối với một bác sĩ lâm sàng, có lẽ có giá trị hơn so với giải thích thô về độ nhạy và độ đặc hiệu.

Biểu đồ này cho thấy mối quan hệ giữa PPV và NPV với mức độ phổ biến, cho một thử nghiệm với độ nhạy 95% và độ đặc hiệu 85%.

Từ Mausner JS, Kramer S: Mausner và Bahn Dịch tễ học: Một văn bản giới thiệu.  Philadelphia, WB Saunders, 1985, tr.  221.

Từ Mausner JS, Kramer S: Mausner và Bahn Dịch tễ học: Một văn bản giới thiệu. Philadelphia, WB Saunders, 1985, tr. 221.


1

@Satwik, @gung và @Tim đã cung cấp rất nhiều chi tiết, nhưng tôi sẽ thử và thêm một ví dụ nhỏ về trường hợp các yếu tố cơ bản có thể gây ra hiệu ứng như vậy.

Nguyên tắc chính: Xu hướng

Độ nhạy / Độ đặc hiệu và TẤT CẢ các thử nghiệm thống kê đều có chung một cảnh báo: nó chỉ áp dụng cho việc lặp lại quy trình lấy mẫu giống như trước đây theo cách không thiên vị.

Các bệnh viện là các tổ chức chức năng được thiết kế để thực hiện lấy mẫu thiên vị, sử dụng các chính sách tuyển sinh để lọc dân số chung thành những người cần nhập viện và điều trị. Đây là rất phản đề của thủ tục khoa học. Nếu bạn muốn biết làm thế nào một bài kiểm tra thực hiện trong các quần thể khác nhau, nó cần phải được kiểm tra trong các quần thể khác nhau.

Hiệu ứng tiềm ẩn: Tương quan

Rất hiếm (hoặc không thể trong thế giới thực nếu bạn muốn nghiêm ngặt) để chẩn đoán độc lập / trực giao với tất cả các yếu tố nguy cơ khác đối với bệnh, do đó có một số mức độ tương quan.

Nếu màn hình nhập viện có tương quan dương với chẩn đoán thì điều bạn sẽ thấy là những người vượt qua bài kiểm tra nhập học được ưu tiên cho kết quả dương tính bởi chẩn đoán, tỷ lệ thuận với tương quan. Do đó, dương tính thật được làm giàu và âm tính giả được giảm theo số lượng tỷ lệ thuận với mối tương quan.

Điều này sau đó làm cho độ nhạy xuất hiện lớn hơn.

Giải thích về hiện tượng

Do đó, một quan sát cho thấy độ nhạy có thể cao hơn trong bối cảnh bệnh viện không phải là không thực tế. Trong thực tế, nếu chính sách tuyển sinh được cân nhắc kỹ lưỡng và phù hợp với mục đích, người ta sẽ mong muốn điều này xảy ra.

Nó không phải là bằng chứng của một sự cố trong giả định rằng độ nhạy và độ đặc hiệu là độc lập phổ biến, thay vào đó là bằng chứng của một mẫu thiên vị dựa trên chính sách nhập viện.

Trong đó, có một bệnh viện ở đó để điều trị cho mọi người và không làm các thí nghiệm khoa học, chắc chắn là một điều tốt.

Nhưng nó làm các nhà khoa học đau đầu.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.