Làm cách nào để tìm xác suất xảy ra lỗi loại II?


12

Tôi biết rằng lỗi Loại II là trong đó H1 là đúng, nhưng H0 không bị từ chối.

Câu hỏi

Làm cách nào để tính xác suất của lỗi Loại II liên quan đến phân phối bình thường, trong đó độ lệch chuẩn được biết đến?



1
Tôi sẽ viết lại câu hỏi này là "làm thế nào để tôi tìm thấy sức mạnh của một bài kiểm tra chung, chẳng hạn như so với ?" Đây thường là thử nghiệm được thực hiện thường xuyên hơn. Tôi không biết người ta sẽ tính toán sức mạnh của bài kiểm tra như thế nào. H 1 : μ > μ 0H0:μ=μ0H1:μ>μ0
xác suất

Câu trả lời:


27

Ngoài việc chỉ định (xác suất xảy ra lỗi loại I), bạn cần biết một cặp giả thuyết được chỉ định đầy đủ, nghĩa là , và cần được biết. (xác suất xảy ra lỗi loại II) là . Tôi giả sử một . Trong R:αμ0μ1σβ1powerH1:μ1>μ0

> sigma <- 15    # theoretical standard deviation
> mu0   <- 100   # expected value under H0
> mu1   <- 130   # expected value under H1
> alpha <- 0.05  # probability of type I error

# critical value for a level alpha test
> crit <- qnorm(1-alpha, mu0, sigma)

# power: probability for values > critical value under H1
> (pow <- pnorm(crit, mu1, sigma, lower.tail=FALSE))
[1] 0.63876

# probability for type II error: 1 - power
> (beta <- 1-pow)
[1] 0.36124

Chỉnh sửa: trực quan hóa

nhập mô tả hình ảnh ở đây

xLims <- c(50, 180)
left  <- seq(xLims[1],   crit, length.out=100)
right <- seq(crit, xLims[2],   length.out=100)
yH0r  <- dnorm(right, mu0, sigma)
yH1l  <- dnorm(left,  mu1, sigma)
yH1r  <- dnorm(right, mu1, sigma)

curve(dnorm(x, mu0, sigma), xlim=xLims, lwd=2, col="red", xlab="x", ylab="density",
      main="Normal distribution under H0 and H1", ylim=c(0, 0.03), xaxs="i")
curve(dnorm(x, mu1, sigma), lwd=2, col="blue", add=TRUE)
polygon(c(right, rev(right)), c(yH0r, numeric(length(right))), border=NA,
        col=rgb(1, 0.3, 0.3, 0.6))
polygon(c(left,  rev(left)),  c(yH1l, numeric(length(left))),  border=NA,
        col=rgb(0.3, 0.3, 1, 0.6))
polygon(c(right, rev(right)), c(yH1r, numeric(length(right))), border=NA,
        density=5, lty=2, lwd=2, angle=45, col="darkgray")
abline(v=crit, lty=1, lwd=3, col="red")
text(crit+1,  0.03,  adj=0, label="critical value")
text(mu0-10,  0.025, adj=1, label="distribution under H0")
text(mu1+10,  0.025, adj=0, label="distribution under H1")
text(crit+8,  0.01,  adj=0, label="power", cex=1.3)
text(crit-12, 0.004,  expression(beta),  cex=1.3)
text(crit+5,  0.0015, expression(alpha), cex=1.3)

1
Có một lỗi đánh máy trong câu trả lời này? Tôi nghĩ cái được gọi là thực sự là và ngược lại. Dù bằng cách nào, đây là một biểu đồ xuất sắc và mã R ví dụ! powβ
jdods

1
@jdods Thật vậy, đã có một lower.tail=FALSEmất tích. Cảm ơn rât nhiều!
caracal

@caracal bạn có thể giải thích, theo ~ thuật ngữ layman, tại sao chúng ta có thể tính giá trị p (rủi ro lỗi loại 1) mà không xem xét beta, nhưng chúng ta cần chỉ định alpha để có thể đo lường rủi ro của lỗi loại 2? Tôi cảm thấy như mình đang thiếu thứ gì đó. Cảm ơn câu trả lời tuyệt vời của bạn.
Cystack

1
@Cystack Ý nghĩa chính xác của giá trị p, lỗi loại 1, lỗi loại 2 nằm ngoài những gì có thể được chuyển tải trong một nhận xét. Tôi sẽ bắt đầu xem câu trả lời cho các câu hỏi như stats.stackexchange.com/q/46856/1909 hoặc stats.stackexchange.com/q/129628/1909 , cũng thấy các hộp "Liên kết" và "Liên quan" ở góc trên bên phải cho nội dung phù hợp hơn.
caracal

1

Để bổ sung câu trả lời của caracal, nếu bạn đang tìm kiếm tùy chọn GUI thân thiện với người dùng để tính tỷ lệ lỗi Loại II hoặc sức mạnh cho nhiều thiết kế phổ biến bao gồm cả những thiết kế được nêu trong câu hỏi của bạn, bạn có thể muốn kiểm tra phần mềm miễn phí, G Power 3 .

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.