Giải thích các bài kiểm tra hai đuôi


16

Tôi đang tìm kiếm nhiều cách giải thích cho học sinh của mình (trong một khóa học thống kê sơ cấp) thế nào là bài kiểm tra hai đuôi và cách tính giá trị P của nó.

Làm thế nào để bạn giải thích cho học sinh của bạn bài kiểm tra hai vs một?

Câu trả lời:


16

Đây là một câu hỏi hay và tôi mong muốn phiên bản của mọi người giải thích giá trị p và thử nghiệm hai đuôi so với thử nghiệm một đuôi. Tôi đã dạy các bác sĩ phẫu thuật chỉnh hình đồng nghiệp và do đó tôi đã cố gắng giữ nó ở mức cơ bản nhất có thể vì hầu hết họ không thực hiện bất kỳ môn toán nâng cao nào trong 10-30 năm.

Cách tôi giải thích tính toán giá trị p & đuôi

Tôi bắt đầu với một giải thích rằng nếu chúng ta tin rằng chúng ta có một đồng tiền công bằng, chúng ta biết rằng nó sẽ kết thúc trung bình 50% số lần lật ( ). Bây giờ nếu bạn tự hỏi xác suất chỉ nhận được 2 đuôi trong số 10 lần lật với đồng tiền công bằng này, bạn có thể tính xác suất đó như tôi đã thực hiện trong biểu đồ thanh. Từ biểu đồ, bạn có thể thấy rằng xác suất nhận được 8 trên 10 lần lật với một đồng tiền công bằng là khoảng 4,4 % .= =H04,4%

Vì chúng tôi sẽ đặt câu hỏi về tính công bằng của đồng xu nếu chúng tôi có 9 hoặc 10 đuôi, chúng tôi phải bao gồm các khả năng này, phần đuôi của bài kiểm tra. Bằng cách thêm các giá trị, chúng tôi nhận được rằng xác suất bây giờ cao hơn một chút so với khi nhận được 2 đuôi hoặc ít hơn.5,5%

Bây giờ nếu chúng ta chỉ có 2 đầu, tức là 8 đầu (đuôi kia), có lẽ chúng ta sẽ sẵn lòng đặt câu hỏi về sự công bằng của đồng xu. Đây có nghĩa là bạn kết thúc với một xác suất cho một bài kiểm tra hai đuôi .5,4 ...%+5,4 ...%10.9%

Vì chúng ta trong y học thường quan tâm đến việc nghiên cứu những thất bại, chúng ta cần bao gồm mặt trái của xác suất ngay cả khi mục đích của chúng ta là làm tốt và đưa ra một phương pháp điều trị có lợi.

Đồ thị lật tiền của tôi

Phản ánh hơi ra khỏi chủ đề

Ví dụ đơn giản này cũng cho thấy mức độ phụ thuộc của chúng ta vào giả thuyết null để tính giá trị p. Tôi cũng muốn chỉ ra sự tương đồng giữa đường cong nhị thức và đường cong hình chuông. Khi thay đổi thành 200 lần lật, bạn có được một cách tự nhiên để giải thích tại sao xác suất nhận được chính xác 100 lần lật bắt đầu thiếu liên quan. Các khoảng xác định quan tâm là một chuyển tiếp tự nhiên đến các hàm hàm mật độ / khối lượng xác suất và các đối tác tích lũy của chúng.

Trong lớp học của tôi, tôi giới thiệu cho họ các video thống kê của học viện Khan và tôi cũng sử dụng một số giải thích của anh ấy cho các khái niệm nhất định. Họ cũng có thể lật đồng xu khi chúng ta nhìn vào sự ngẫu nhiên của việc lật đồng xu - điều mà tôi cố gắng thể hiện là sự ngẫu nhiên là ngẫu nhiên hơn những gì chúng ta thường tin lấy cảm hứng từ tập Radiolab này .

Mật mã

Tôi thường có một biểu đồ / slide, mã R mà tôi đã sử dụng để tạo biểu đồ:

library(graphics)

binom_plot_function <- function(x_max, my_title = FALSE, my_prob = .5, edges = 0, 
                                col=c("green", "gold", "red")){
  barplot(
    dbinom(0:x_max, x_max, my_prob)*100, 
    col=c(rep(col[1], edges), rep(col[2], x_max-2*edges+1), rep(col[3], edges)),
    #names=0:x_max,
    ylab="Probability %",
    xlab="Number of tails", names.arg=0:x_max)
  if (my_title != FALSE ){
    title(main=my_title)
  }
}

binom_plot_function(10, paste("Flipping coins", 10, "times"), edges=0, col=c("#449944", "gold", "#994444"))
binom_plot_function(10, edges=3, col=c(rgb(200/255, 0, 0), "gold", "gold"))
binom_plot_function(10, edges=3, col=c(rgb(200/255, 0, 0), "gold", rgb(200/255, 100/255, 100/255)))

Câu trả lời tuyệt vời Max - và cảm ơn bạn vì đã nhận ra sự không tầm thường trong câu hỏi của tôi :)
Tal Galili

+1 câu trả lời hay, rất kỹ lưỡng. Hãy tha thứ cho tôi, nhưng tôi sẽ cố gắng thực hiện hai điều. 1) giá trị p được hiểu là xác suất dữ liệu cực trị hoặc cực đoan hơn giá trị của bạn dưới giá trị null, do đó câu trả lời của bạn là đúng. Tuy nhiên, khi sử dụng dữ liệu rời rạc như lật đồng xu của bạn, điều này là không bảo thủ. Tốt nhất là sử dụng cái được gọi là "giá trị trung bình", tức là 1/2 xác suất dữ liệu cực kỳ giống với bạn + xác suất dữ liệu cực đoan hơn. Một cuộc thảo luận dễ dàng về những vấn đề này có thể được tìm thấy trong Agresti (2007) 2.6.3. (tt)
gung - Tái lập Monica

2) Bạn nói rằng sự ngẫu nhiên là ngẫu nhiên hơn chúng ta tin. Tôi có thể đoán ý của bạn là gì (tôi chưa có cơ hội nghe tập Radiolab mà bạn liên kết, nhưng tôi sẽ làm vậy). Thật kỳ lạ, tôi luôn nói với sinh viên rằng sự ngẫu nhiên ít ngẫu nhiên hơn bạn tin. Ở đây tôi đang đề cập đến nhận thức về các vệt (ví dụ, trong cờ bạc). Mọi người tin rằng các sự kiện ngẫu nhiên nên xen kẽ nhiều hơn các sự kiện ngẫu nhiên thực sự làm, và kết quả là tin rằng họ nhìn thấy các vệt. Xem Falk (1997) Tạo cảm giác ngẫu nhiên Psych Rev 104,2. Một lần nữa, bạn không sai - chỉ là thức ăn cho suy nghĩ.
gung - Phục hồi Monica

Cảm ơn bạn @gung cho đầu vào của bạn. Tôi thực sự không nghe nói về giá trị giữa - mặc dù nó có ý nghĩa. Tôi không chắc chắn nếu đó là điều tôi sẽ đề cập khi dạy các số liệu thống kê cơ bản vì nó có thể mang lại cảm giác mất đi cảm giác thực tế mà tôi cố gắng đưa ra. Liên quan đến tính ngẫu nhiên, chúng tôi có nghĩa là giống hệt nhau - khi nhìn thấy một con số thực sự ngẫu nhiên, chúng tôi bị lừa nghĩ rằng có một mô hình cho nó. Tôi nghĩ rằng tôi đã nghe trên podcast Freakonomics hoàn toàn dự đoán rằng ...
Max Gordon

... Tâm trí con người trong nhiều năm đã học được rằng việc không phát hiện ra một kẻ săn mồi sẽ tốn kém hơn là nghĩ rằng có lẽ không có gì. Tôi thích sự tương tự đó và tôi cố gắng nói với các đồng nghiệp của mình rằng một trong những lý do chính để sử dụng số liệu thống kê là để giúp chúng tôi với khiếm khuyết này mà tất cả chúng ta sinh ra.
Max Gordon

9

Giả sử bạn muốn kiểm tra giả thuyết rằng chiều cao trung bình của nam giới là "5 ft 7 inch". Bạn chọn một mẫu ngẫu nhiên của đàn ông, đo chiều cao của họ và tính giá trị trung bình của mẫu. Giả thuyết của bạn sau đó là:

H0:μ= =5 ft 7 inch

HMột:μ5 ft 7 inch

Trong tình huống trên, bạn thực hiện kiểm tra hai đuôi vì bạn sẽ từ chối null của mình nếu trung bình mẫu quá thấp hoặc quá cao.

Trong trường hợp này, giá trị p đại diện cho xác suất nhận ra một mẫu có nghĩa là ít nhất là cực trị như giá trị mà chúng ta thực sự thu được khi cho rằng null thực tế là đúng. Do đó, nếu quan sát mẫu có nghĩa là "5 ft 8 inch" thì giá trị p sẽ đại diện cho xác suất chúng ta sẽ quan sát chiều cao lớn hơn "5 ft 8 inch" hoặc chiều cao nhỏ hơn "5 ft 6 inch" với giá trị null là đúng.

Nếu mặt khác, sự thay thế của bạn được đóng khung như vậy:

HMột:μ>5 ft 7 inch

Trong tình huống trên, bạn sẽ làm một bài kiểm tra một phía ở bên phải. Lý do là bạn chỉ muốn từ chối null để thay thế chỉ khi giá trị trung bình mẫu cực kỳ cao.

Việc giải thích giá trị p vẫn giữ nguyên với sắc thái nhỏ mà chúng ta đang nói về xác suất nhận ra một mẫu có nghĩa là lớn hơn so với giá trị chúng ta thực sự thu được. Do đó, nếu quan sát mẫu có nghĩa là "5 ft 8 inch" thì giá trị p sẽ đại diện cho xác suất chúng ta sẽ quan sát chiều cao lớn hơn "5 ft 8 inch" với điều kiện null là đúng.


2
HMộtH0:μ5 ft 7 inchH0:μ= =5 ft 7 inch

2
@chl Tôi đồng ý. Tuy nhiên, đối với một người vừa được giới thiệu các ý tưởng thống kê, việc viết lại null cho bài kiểm tra một đầu có thể là một sự phân tâm khi trọng tâm là cách thức và lý do mọi thứ thay đổi liên quan đến việc giải thích giá trị p.
varty

1
Đủ công bằng. Điều đó đáng được đề cập mặc dù, ngay cả cho mục đích giảng dạy.
chl
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.