Tôi đang tìm kiếm nhiều cách giải thích cho học sinh của mình (trong một khóa học thống kê sơ cấp) thế nào là bài kiểm tra hai đuôi và cách tính giá trị P của nó.
Làm thế nào để bạn giải thích cho học sinh của bạn bài kiểm tra hai vs một?
Tôi đang tìm kiếm nhiều cách giải thích cho học sinh của mình (trong một khóa học thống kê sơ cấp) thế nào là bài kiểm tra hai đuôi và cách tính giá trị P của nó.
Làm thế nào để bạn giải thích cho học sinh của bạn bài kiểm tra hai vs một?
Câu trả lời:
Đây là một câu hỏi hay và tôi mong muốn phiên bản của mọi người giải thích giá trị p và thử nghiệm hai đuôi so với thử nghiệm một đuôi. Tôi đã dạy các bác sĩ phẫu thuật chỉnh hình đồng nghiệp và do đó tôi đã cố gắng giữ nó ở mức cơ bản nhất có thể vì hầu hết họ không thực hiện bất kỳ môn toán nâng cao nào trong 10-30 năm.
Tôi bắt đầu với một giải thích rằng nếu chúng ta tin rằng chúng ta có một đồng tiền công bằng, chúng ta biết rằng nó sẽ kết thúc trung bình 50% số lần lật ( ). Bây giờ nếu bạn tự hỏi xác suất chỉ nhận được 2 đuôi trong số 10 lần lật với đồng tiền công bằng này, bạn có thể tính xác suất đó như tôi đã thực hiện trong biểu đồ thanh. Từ biểu đồ, bạn có thể thấy rằng xác suất nhận được 8 trên 10 lần lật với một đồng tiền công bằng là khoảng ≈ 4,4 % .
Vì chúng tôi sẽ đặt câu hỏi về tính công bằng của đồng xu nếu chúng tôi có 9 hoặc 10 đuôi, chúng tôi phải bao gồm các khả năng này, phần đuôi của bài kiểm tra. Bằng cách thêm các giá trị, chúng tôi nhận được rằng xác suất bây giờ cao hơn một chút so với khi nhận được 2 đuôi hoặc ít hơn.
Bây giờ nếu chúng ta chỉ có 2 đầu, tức là 8 đầu (đuôi kia), có lẽ chúng ta sẽ sẵn lòng đặt câu hỏi về sự công bằng của đồng xu. Đây có nghĩa là bạn kết thúc với một xác suất cho một bài kiểm tra hai đuôi .
Vì chúng ta trong y học thường quan tâm đến việc nghiên cứu những thất bại, chúng ta cần bao gồm mặt trái của xác suất ngay cả khi mục đích của chúng ta là làm tốt và đưa ra một phương pháp điều trị có lợi.
Ví dụ đơn giản này cũng cho thấy mức độ phụ thuộc của chúng ta vào giả thuyết null để tính giá trị p. Tôi cũng muốn chỉ ra sự tương đồng giữa đường cong nhị thức và đường cong hình chuông. Khi thay đổi thành 200 lần lật, bạn có được một cách tự nhiên để giải thích tại sao xác suất nhận được chính xác 100 lần lật bắt đầu thiếu liên quan. Các khoảng xác định quan tâm là một chuyển tiếp tự nhiên đến các hàm hàm mật độ / khối lượng xác suất và các đối tác tích lũy của chúng.
Trong lớp học của tôi, tôi giới thiệu cho họ các video thống kê của học viện Khan và tôi cũng sử dụng một số giải thích của anh ấy cho các khái niệm nhất định. Họ cũng có thể lật đồng xu khi chúng ta nhìn vào sự ngẫu nhiên của việc lật đồng xu - điều mà tôi cố gắng thể hiện là sự ngẫu nhiên là ngẫu nhiên hơn những gì chúng ta thường tin lấy cảm hứng từ tập Radiolab này .
Tôi thường có một biểu đồ / slide, mã R mà tôi đã sử dụng để tạo biểu đồ:
library(graphics)
binom_plot_function <- function(x_max, my_title = FALSE, my_prob = .5, edges = 0,
col=c("green", "gold", "red")){
barplot(
dbinom(0:x_max, x_max, my_prob)*100,
col=c(rep(col[1], edges), rep(col[2], x_max-2*edges+1), rep(col[3], edges)),
#names=0:x_max,
ylab="Probability %",
xlab="Number of tails", names.arg=0:x_max)
if (my_title != FALSE ){
title(main=my_title)
}
}
binom_plot_function(10, paste("Flipping coins", 10, "times"), edges=0, col=c("#449944", "gold", "#994444"))
binom_plot_function(10, edges=3, col=c(rgb(200/255, 0, 0), "gold", "gold"))
binom_plot_function(10, edges=3, col=c(rgb(200/255, 0, 0), "gold", rgb(200/255, 100/255, 100/255)))
Giả sử bạn muốn kiểm tra giả thuyết rằng chiều cao trung bình của nam giới là "5 ft 7 inch". Bạn chọn một mẫu ngẫu nhiên của đàn ông, đo chiều cao của họ và tính giá trị trung bình của mẫu. Giả thuyết của bạn sau đó là:
Trong tình huống trên, bạn thực hiện kiểm tra hai đuôi vì bạn sẽ từ chối null của mình nếu trung bình mẫu quá thấp hoặc quá cao.
Trong trường hợp này, giá trị p đại diện cho xác suất nhận ra một mẫu có nghĩa là ít nhất là cực trị như giá trị mà chúng ta thực sự thu được khi cho rằng null thực tế là đúng. Do đó, nếu quan sát mẫu có nghĩa là "5 ft 8 inch" thì giá trị p sẽ đại diện cho xác suất chúng ta sẽ quan sát chiều cao lớn hơn "5 ft 8 inch" hoặc chiều cao nhỏ hơn "5 ft 6 inch" với giá trị null là đúng.
Nếu mặt khác, sự thay thế của bạn được đóng khung như vậy:
Trong tình huống trên, bạn sẽ làm một bài kiểm tra một phía ở bên phải. Lý do là bạn chỉ muốn từ chối null để thay thế chỉ khi giá trị trung bình mẫu cực kỳ cao.
Việc giải thích giá trị p vẫn giữ nguyên với sắc thái nhỏ mà chúng ta đang nói về xác suất nhận ra một mẫu có nghĩa là lớn hơn so với giá trị chúng ta thực sự thu được. Do đó, nếu quan sát mẫu có nghĩa là "5 ft 8 inch" thì giá trị p sẽ đại diện cho xác suất chúng ta sẽ quan sát chiều cao lớn hơn "5 ft 8 inch" với điều kiện null là đúng.