Số liệu thống kê: Mối quan hệ giữa Alpha và Beta


13

Câu hỏi của tôi liên quan đến mối quan hệ giữa alpha và beta và định nghĩa của chúng trong thống kê.

alpha = tỷ lệ lỗi loại I = mức ý nghĩa được xem xét rằng giả thuyết NULL là chính xác

Beta = tỷ lệ lỗi loại II

Nếu alpha bị hạ thấp (độ đặc hiệu tăng khi alpha = 1- độ đặc hiệu), beta tăng (độ nhạy / công suất giảm khi beta = 1 - độ nhạy / công suất)

Làm thế nào để thay đổi trong alpha ảnh hưởng đến beta? Có mối quan hệ tuyến tính hay không? Do tỷ lệ alpha / beta luôn giống nhau, nói cách khác, độ đặc hiệu / độ nhạy của tỷ lệ luôn giống nhau? Nếu có, điều đó có nghĩa là bằng cách sử dụng hiệu chỉnh bonferroni, chúng ta chỉ chuyển sang độ nhạy thấp hơn và độ đặc hiệu cao hơn nhưng chúng ta không thay đổi tỷ lệ độ nhạy / độ đặc hiệu. Điều đó có đúng không?

Cập nhật (Câu hỏi cụ thể):

Đối với một thiết kế thử nghiệm nhất định, chúng tôi chạy 5 Mô hình tuyến tính trên dữ liệu. Chúng tôi có Tỷ lệ dương thực sự (độ nhạy / sức mạnh) ở mức 0,8 và Tỷ lệ âm tính thực (độ đặc hiệu) là 0,7. (Hãy tưởng tượng chúng ta biết những gì nên tích cực và những gì không nên.). Nếu bây giờ chúng ta sửa mức ý nghĩa bằng cách sử dụng Bonferroni thành 0,05 / 5 = 0,01. Chúng ta có thể ước tính bằng số lượng kết quả Tỷ lệ dương thực sự (độ nhạy / công suất) và Tỷ lệ âm tính thực (Độ đặc hiệu) không?

Cảm ơn sự giúp đỡ của bạn.

Câu trả lời:


16

β có liên quan. Tôi sẽ cố gắng minh họa điểm bằng một xét nghiệm chẩn đoán. Giả sử bạn có xét nghiệm chẩn đoán đo mức độ của dấu máu. Người ta biết rằng những người mắc một bệnh nào đó có mức độ đánh dấu này thấp hơn so với những người khỏe mạnh. Rõ ràng là bạn phải quyết định giá trị ngưỡng, dưới đó một người được phân loại là "bệnh" trong khi những người có giá trị cao hơn mức cắt này được cho là khỏe mạnh. Tuy nhiên, rất có khả năng là sự phân phối của máy đo huyết áp thay đổi đáng kể ngay cảở nhữngngười ốm yếu và khỏe mạnh. Một số người khỏe mạnh có thể có mức độ đánh dấu máu rất thấp, mặc dù họ hoàn toàn khỏe mạnh. Và một số người bệnh có mức độ đánh dấu máu cao mặc dù họ mắc bệnh.αβ

Có bốn khả năng có thể xảy ra:

  1. một người bệnh được xác định chính xác là bị bệnh (dương tính thật = TP)
  2. một người bệnh được phân loại sai là khỏe mạnh (âm tính giả = FN)
  3. một người khỏe mạnh được xác định chính xác là khỏe mạnh (âm tính thật = TN)
  4. một người khỏe mạnh được phân loại sai là bệnh (dương tính giả = FP)

Những khả năng này có thể được minh họa bằng bảng 2x2 :

               Sick Healthy
Test positive   TP     FP
Test negative   FN     TN

αα=FP/(FP+TN)ββ=FN/(TP+FN)R

alphabeta <- function(mean.sick=100, sd.sick=10, mean.healthy=130, sd.healthy=10, cutoff=120, n=10000, side="below", do.plot=TRUE) {

  popsick <- rnorm(n, mean=mean.sick, sd=sd.sick)
  pophealthy <- rnorm(n, mean=mean.healthy, sd=sd.healthy)

  if ( side == "below" ) {

    truepos <- length(popsick[popsick <= cutoff])
    falsepos <- length(pophealthy[pophealthy <= cutoff])
    trueneg <- length(pophealthy[pophealthy > cutoff])
    falseneg <- length(popsick[popsick > cutoff])

  } else if ( side == "above" ) {

    truepos <- length(popsick[popsick >= cutoff])
    falsepos <- length(pophealthy[pophealthy >= cutoff])
    trueneg <- length(pophealthy[pophealthy < cutoff])
    falseneg <- length(popsick[popsick < cutoff])

  }

  twotable <- matrix(c(truepos, falsepos, falseneg, trueneg), 2, 2, byrow=T)
  rownames(twotable) <- c("Test positive", "Test negative")
  colnames(twotable) <- c("Sick", "Healthy")

  spec <- twotable[2,2]/(twotable[2,2] + twotable[1,2])
  alpha <- 1 - spec
  sens <- pow <- twotable[1,1]/(twotable[1,1] + twotable[2,1])
  beta <- 1 - sens

  pos.pred <- twotable[1,1]/(twotable[1,1] + twotable[1,2])
  neg.pred <- twotable[2,2]/(twotable[2,2] + twotable[2,1])


  if ( do.plot == TRUE ) {

    dsick <- density(popsick)
    dhealthy <- density(pophealthy)

    par(mar=c(5.5, 4, 0.5, 0.5))
    plot(range(c(dsick$x, dhealthy$x)), range(c(c(dsick$y, dhealthy$y))), type = "n", xlab="", ylab="", axes=FALSE)
    box()
    axis(1, at=mean(pophealthy), lab=substitute(mu[H[0]]~paste("=",m, sep=""), list(m=mean.healthy)), cex.axis=1.5,tck=0.02)
    axis(1, at=mean(popsick), lab=substitute(mu[H[1]]~paste("=",m, sep=""), list(m=mean.sick)), cex.axis=1.5, tck=0.02)                                        
    axis(1, at=cutoff, lab=substitute(italic(paste("Cutoff=",coff, sep="")), list(coff=cutoff)), pos=-0.004, tick=FALSE, cex.axis=1.25)
    lines(dhealthy, col = "steelblue", lwd=2)

    if ( side == "below" ) {
      polygon(c(cutoff, dhealthy$x[dhealthy$x<=cutoff], cutoff), c(0, dhealthy$y[dhealthy$x<=cutoff],0), col = "grey65")
    } else if ( side == "above" ) {
      polygon(c(cutoff, dhealthy$x[dhealthy$x>=cutoff], cutoff), c(0, dhealthy$y[dhealthy$x>=cutoff],0), col = "grey65")
    }

    lines(dsick, col = "red", lwd=2)

    if ( side == "below" ) {
      polygon(c(cutoff,dsick$x[dsick$x>cutoff],cutoff),c(0,dsick$y[dsick$x>cutoff],0) , col="grey90")
    } else if ( side == "above" ) {
      polygon(c(cutoff,dsick$x[dsick$x<=cutoff],cutoff),c(0,dsick$y[dsick$x<=cutoff],0) , col="grey90")
    }

    legend("topleft",
           legend=(c(as.expression(substitute(alpha~paste("=", a), list(a=round(alpha,3)))), 
                     as.expression(substitute(beta~paste("=", b), list(b=round(beta,3)))))), fill=c("grey65", "grey90"), cex=1.2, bty="n")
    abline(v=mean(popsick), lty=3)
    abline(v=mean(pophealthy), lty=3)
    abline(v=cutoff, lty=1, lwd=1.5)
    abline(h=0)

  }

  #list(specificity=spec, sensitivity=sens, alpha=alpha, beta=beta, power=pow, positiv.predictive=pos.pred, negative.predictive=neg.pred)

  c(alpha, beta)

}

Hãy xem xét một ví dụ. Chúng tôi giả định rằng mức trung bình của điểm đánh dấu máu trong số những người bị bệnh là 100 với độ lệch chuẩn là 10. Trong số những người khỏe mạnh, mức máu trung bình là 140 với độ lệch chuẩn là 15. Bác sĩ lâm sàng đặt mức cắt là 120.

alphabeta(mean.sick=100, sd.sick=10, mean.healthy=140, sd.healthy=15, cutoff=120, n=100000, do.plot=TRUE, side="below")

              Sick Healthy
Test positive 9764     901
Test negative  236    9099

Beta và alpha với mức cắt 120

α=901/(901+9099)0.09β=236/(236+9764)0.024

              Sick Healthy
Test positive 6909      90
Test negative 3091    9910

Cắt 105

αβ

αβ

cutoffs <- seq(0, 200, by=0.1)
cutoff.grid <- expand.grid(cutoffs)

plot.frame <- apply(cutoff.grid, MARGIN=1, FUN=alphabeta, mean.sick=100, sd.sick=10, mean.healthy=140, sd.healthy=15, n=100000, do.plot=FALSE, side="below")

plot(plot.frame[1,]~cutoffs, type="l", las=1, xlab="Cutoff value", ylab="Alpha/Beta", lwd=2, cex.axis=1.5, cex.lab=1.2)
lines(plot.frame[2,]~cutoffs, col="steelblue", lty=2, lwd=2)
legend("topleft", legend=c(expression(alpha), expression(beta)), lwd=c(2,2),lty=c(1,2), col=c("black", "steelblue"), bty="n", cex=1.2)

Âm mưu của alpha và beta với các giá trị ngưỡng khác nhau

αβ

Cắt hoàn hảo

Ở đây chúng tôi có một bài kiểm tra "hoàn hảo" theo nghĩa là việc cắt 150 người phân biệt người bệnh với người khỏe mạnh.


Điều chỉnh Bonferroni

αββ0.020.31α0.090.01


@COOLSerdash Wow câu trả lời hay! Cảm ơn bạn. Trong ví dụ của bạn, sự lựa chọn mức đáng kể có thể được thực hiện trên các bản phân phối đã biết. Trong sinh học chẳng hạn, bạn không thể biết được sự phân bố của biến phụ thuộc nếu việc điều trị có hiệu quả. Nói cách khác, bằng cách chọn mức ý nghĩa, bạn chọn Tỷ lệ dương tính giả nhưng bạn gần như không biết tỷ lệ Sai âm được đặt như thế nào. Vì bạn thực sự không có ý tưởng nào về cách đặt Tỷ lệ Tích cực và Tiêu cực thật sự. Đúng không ?
Remi.b

1
αα1βαβpα

2

Đối với những người khác trong tương lai:

Trong ước tính Kích thước mẫu, Ztotal được tính bằng cách thêm Z tương ứng với alpha và Z tương ứng với công suất (1-beta). Vì vậy, về mặt toán học, nếu kích thước mẫu được giữ không đổi, tăng Z cho alpha có nghĩa là bạn giảm Z cho công suất bằng số lượng CÙNG, ví dụ, tăng Zalpha từ 0,05 xuống 0,1 giảm Zpower xuống 0,05.

Sự khác biệt là Z cho alpha là hai đuôi trong khi Z cho beta là 1 đuôi. Vì vậy, trong khi giá trị Z thay đổi theo cùng một lượng, nhưng xác suất% mà giá trị Z này tương ứng không thay đổi theo cùng một lượng.

Thí dụ:

5% alpha (độ tin cậy 95%) với 80% năng lượng (20% beta) cho cùng cỡ mẫu như

20% alpha (độ tin cậy 80%) với 93,6% sức mạnh (6,4% beta) thay vì 95% sức mạnh chúng ta sẽ có nếu mối quan hệ là 1: 1.


1

Không có mối quan hệ chung giữa alpha và beta.

Tất cả phụ thuộc vào bài kiểm tra của bạn, hãy lấy ví dụ đơn giản:

(Wikipedia)

Trong sử dụng thông tục, lỗi loại I có thể được coi là "kết án một người vô tội" và lỗi loại II "để cho một người có tội được tự do".

Một bồi thẩm đoàn có thể nghiêm trọng: không có lỗi loại II, một số bồi thẩm loại I Một bồi thẩm đoàn có thể là "loại": không có loại I nhưng một số bồi thẩm đoàn loại II có thể bình thường: một số ban giám khảo loại I và một loại II có thể hoàn hảo: không có lỗi

Trong thực tế có hai tác dụng đối kháng:

Khi chất lượng của bài kiểm tra tăng lên, lỗi loại I và loại II giảm cho đến một thời điểm nào đó. Khi bồi thẩm đoàn cải thiện, anh ta có xu hướng đưa ra phán xét tốt hơn đối với cả những người vô tội và có tội.

Sau một thời gian, vấn đề cơ bản xuất hiện trong việc xây dựng bài kiểm tra. Loại I hoặc II quan trọng hơn đối với người chạy thử nghiệm. Với gương mẫu bồi thẩm đoàn, lỗi loại I là quan trọng hơn và vì vậy quy trình pháp luật được xây dựng để tránh loại I. Nếu có bất kỳ nghi ngờ nào thì người đó được tự do. Theo trực giác điều này dẫn đến một sự tăng trưởng trong lỗi loại II.

Liên quan đến Bonferroni:

(Wikipedia lại)

Bonferroni điều chỉnh chỉ kiểm soát xác suất dương tính giả. Việc điều chỉnh thông thường phải trả giá bằng việc tăng xác suất tạo ra âm tính giả, và do đó làm giảm sức mạnh thống kê. Khi kiểm tra một số lượng lớn các giả thuyết, điều này có thể dẫn đến các giá trị quan trọng lớn.


Cảm ơn câu trả lời của bạn, Nó rất hữu ích nhưng vẫn còn một cái gì đó không rõ ràng với tôi. Tôi cập nhật bài viết của tôi thêm một câu hỏi mới.
Remi.b
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.