Làm thế nào để hình dung độc lập hai bài kiểm tra mẫu?


11

Các cách được chấp nhận nhất để hình dung kết quả của một bài kiểm tra hai mẫu độc lập là gì? Là một bảng số thường được sử dụng hơn hoặc một số loại cốt truyện? Mục tiêu là để một người quan sát bình thường nhìn vào hình và ngay lập tức thấy rằng họ có thể đến từ hai quần thể khác nhau.


"Được chấp nhận" bởi ai, trong bối cảnh nào? "Thường dùng hơn" ở đâu?
Glen_b -Reinstate Monica

Câu trả lời:


18

Đó là giá trị rõ ràng về mục đích của cốt truyện của bạn. Nói chung, có hai loại mục tiêu khác nhau: bạn có thể tự lập các âm mưu để đánh giá các giả định bạn đang thực hiện và hướng dẫn quy trình phân tích dữ liệu hoặc bạn có thể thực hiện các âm mưu để truyền đạt kết quả cho người khác. Những cái này không giống nhau; ví dụ, nhiều người xem / người đọc phân tích / phân tích của bạn có thể không thống kê về mặt thống kê và có thể không quen thuộc với ý tưởng về phương sai tương đương và vai trò của nó trong bài kiểm tra t. Bạn muốn âm mưu của bạn truyền tải thông tin quan trọng về dữ liệu của bạn ngay cả với người tiêu dùng như họ. Họ đang ngầm tin tưởng rằng bạn đã làm mọi thứ một cách chính xác. Từ thiết lập câu hỏi của bạn, tôi tập hợp bạn sau loại sau.

Trên thực tế, âm mưu phổ biến nhất và được chấp nhận để truyền đạt kết quả của bài kiểm tra t 1 cho người khác (đặt sang một bên xem nó có thực sự phù hợp nhất hay không) là biểu đồ thanh phương tiện với các thanh lỗi chuẩn. Điều này rất phù hợp với kiểm tra t trong đó kiểm tra t so sánh hai phương tiện sử dụng các lỗi tiêu chuẩn của chúng. Khi bạn có hai nhóm độc lập, điều này sẽ mang lại một hình ảnh trực quan, ngay cả đối với những người không thống kê về mặt thống kê và mọi người có thể "ngay lập tức thấy rằng họ có thể đến từ hai quần thể khác nhau". Đây là một ví dụ đơn giản sử dụng dữ liệu của @ Tim:

nonsmokers <- c(18,22,21,17,20,17,23,20,22,21)
smokers <- c(16,20,14,21,20,18,13,15,17,21)
m        = c(mean(nonsmokers), mean(smokers))
names(m) = c("nonsmokers", "smokers")
se       = c(sd(nonsmokers)/sqrt(length(nonsmokers)), 
             sd(smokers)/sqrt(length(smokers)))
windows()
  bp = barplot(m, ylim=c(16, 21), xpd=FALSE)
  box()
  arrows(x0=bp, y0=m-se, y1=m+se, code=3, angle=90)

nhập mô tả hình ảnh ở đây

Điều đó nói rằng, các chuyên gia trực quan hóa dữ liệu thường coi thường các lô này. Chúng thường bị chế giễu là "lô thuốc nổ" (xem, Tại sao lô thuốc nổ là xấu ). Đặc biệt, nếu bạn chỉ có một vài dữ liệu, bạn thường chỉ nên hiển thị dữ liệu đó . Nếu các điểm trùng nhau, bạn có thể xáo trộn chúng theo chiều ngang (thêm một lượng nhiễu ngẫu nhiên nhỏ) để chúng không còn chồng lấp. Bởi vì kiểm tra t về cơ bản là về phương tiện và lỗi tiêu chuẩn, tốt nhất là phủ lớp phương tiện và lỗi tiêu chuẩn lên một âm mưu như vậy. Đây là một phiên bản khác nhau:

set.seed(4643)
plot(jitter(rep(c(0,1), each=10)), c(nonsmokers, smokers), axes=FALSE, 
     xlim=c(-.5, 1.5), xlab="", ylab="")
box()
axis(side=1, at=0:1, labels=c("nonsmokers", "smokers"))
axis(side=2, at=seq(14,22,2))
points(c(0,1), m, pch=15, col="red")
arrows(x0=c(0,1), y0=m-se, y1=m+se, code=3, angle=90, length=.15)

nhập mô tả hình ảnh ở đây

Nếu bạn có nhiều dữ liệu, boxplots có thể là lựa chọn tốt hơn để có cái nhìn tổng quan nhanh về các bản phân phối và bạn có thể phủ lên các phương tiện và SE cũng ở đó.

data(randu)
x1 = qnorm(randu[,1])
x2 = qnorm(randu[,2])
m  = c(mean(x1), mean(x2))
se = c(sd(x1)/sqrt(length(x1)), sd(x2)/sqrt(length(x2)))
boxplot(x1, x2)
points(c(1,2), m, pch=15, col="red")
arrows(x0=1:2, y0=m-(1.96*se), y1=m+(1.96*se), code=3, angle=90, length=.1)
# note that I plotted 95% CIs so that they will be easier to see

nhập mô tả hình ảnh ở đây

Các sơ đồ đơn giản của dữ liệu và các ô vuông, đủ đơn giản để hầu hết mọi người có thể hiểu chúng ngay cả khi họ không hiểu biết về thống kê. Mặc dù vậy, hãy nhớ rằng không ai trong số này giúp dễ dàng đánh giá tính hợp lệ của việc sử dụng kiểm tra t để so sánh các nhóm của bạn. Những mục tiêu đó được phục vụ tốt nhất bởi các loại lô khác nhau.

1. Lưu ý rằng cuộc thảo luận này giả định một thử nghiệm mẫu độc lập. Các ô này có thể được sử dụng với kiểm tra mẫu phụ thuộc, nhưng cũng có thể gây hiểu nhầm trong bối cảnh đó (xem, Sử dụng các thanh lỗi cho phương tiện trong nghiên cứu bên trong đối tượng có sai không? ).


Một vấn đề lớn khi sử dụng biểu đồ bar + CI là đôi khi sự khác biệt có ý nghĩa thống kê, nhưng các TCTD chồng chéo . Cho rằng cốt truyện của bar + CI cố gắng thu hút khán giả nói chung, chúng tôi thực sự không muốn dành thời gian giải thích cho nếp nhăn thêm này.
Heisenberg

@Heisenberg, tôi biết điều đó. Không có cốt truyện duy nhất, hoàn hảo cho tất cả các dịp và mục đích. Tôi cũng không đề cập đến các TCTD, chỉ các SE (mặc dù điều đó sẽ tương đương với một số CI, tùy thuộc vào df). Ý nghĩa thường được đề cập trong chú thích hình và được thảo luận trong văn bản. Nếu bạn muốn nó được hiển thị rõ ràng trong chính cốt truyện, bạn có thể thêm dấu ngoặc và giá trị p (ví dụ: tại đây ).
gung - Phục hồi Monica

Lời xin lỗi của tôi nếu âm thanh nghe có vẻ hung hăng. Tôi chỉ nói một chút rằng cuối cùng vẫn không có cách nào thanh lịch để hình dung một bài kiểm tra t cho khán giả nói chung mà không giải thích thêm. Nó có thể đi xuống âm mưu: 2 ô hiển thị nghĩa là nhóm với SE và âm mưu thứ ba cho thấy sự khác biệt và CI của nó (như liên kết của bạn ). Nhưng hình dung như vậy cho thấy thông tin dư thừa (nhóm có nghĩa là VÀ khác biệt về phương tiện), điều này cũng có thể gây nhầm lẫn cho khán giả.
Heisenberg

@Heisenberg, tôi sẽ không sử dụng cốt truyện từ câu trả lời khác của mình trừ khi tôi đang cố gắng hiển thị một bài kiểm tra bên trong bệnh nhân. Tôi nghĩ rằng có lẽ thường là tốt để trình bày 2 thanh w / SE cho một bài kiểm tra t, với chú thích hình đơn giản. Nếu bạn cần ý nghĩa trong cốt truyện, bạn có thể thêm dấu ngoặc hoặc những thứ tương tự (tôi thường thấy nó không cần thiết).
gung - Phục hồi Monica

14

t

> nonsmokers <- c(18,22,21,17,20,17,23,20,22,21)
> smokers <- c(16,20,14,21,20,18,13,15,17,21)
> 
> t.test(nonsmokers, smokers)

    Welch Two Sample t-test

data:  nonsmokers and smokers
t = 2.2573, df = 16.376, p-value = 0.03798
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 0.1628205 5.0371795
sample estimates:
mean of x mean of y 
     20.1      17.5 

nhập mô tả hình ảnh ở đây

Trên thực tế, boxplots thường được sử dụng để kiểm tra giả thuyết "không chính thức", ví dụ như được mô tả bởi Yoav Stewamini trong bài báo năm 1988 Mở hộp của Boxplot :

Boxplot thông thường được bổ sung bởi khoảng tin cậy gần đúng cho trung vị của lô, được hiển thị dưới dạng một cặp nêm được lấy ra khỏi các cạnh của hộp. Các khoảng tin cậy này được xây dựng theo cách mà khi hai rãnh của các ô vuông khác nhau không trùng nhau thì trung vị của chúng khác nhau đáng kể. (...) Vì công thức cho khoảng tin cậy là một lần không đổi trong phạm vi liên vùng chia cho căn bậc hai của kích thước lô, nên có thể cảm nhận được sau từ chiều dài của nêm so với chiều dài của hộp.

Xem thêm: Kiểm tra T chỉ sử dụng dữ liệu tóm tắt trong một ô vuông

t

nhập mô tả hình ảnh ở đây

ttt-test trong tình huống này. Ưu điểm chính của cốt truyện như vậy là nó cho phép bạn dễ dàng đánh giá mức độ khác biệt của phương tiện bằng cách nhìn vào độ dốc của đường. Nhược điểm của nó có thể là nó có thể gợi ý rằng có một số "tính liên tục" giữa các phương tiện (nghĩa là bạn đã ghép các mẫu).

nhập mô tả hình ảnh ở đây

t

Việc xem xét đầu tiên là giá trị thông tin của hình trong văn bản của bài báo sẽ xuất hiện. Nếu con số không bổ sung đáng kể vào sự hiểu biết về bài báo hoặc sao chép các yếu tố khác của bài báo, thì không nên đưa nó vào.


4
Điều này thực sự phổ biến, ngay cả trong các văn bản thảo luận về kiểm tra t và ANOVA, tuy nhiên nó vẫn là một lựa chọn phi thường. Biểu đồ hộp không hiển thị bất kỳ số lượng nào liên quan đến phép thử t trực tiếp. Tối thiểu, một âm mưu thích hợp sẽ hiển thị các phương tiện và cung cấp nhiều chi tiết hơn về phân phối so với một âm mưu hộp. Các chi tiết trong đuôi thường rất quan trọng trong việc diễn giải bài kiểm tra.
Nick Cox

OK @NickCox, bộ dữ liệu được chọn chỉ để trực quan hóa, nhưng bây giờ tôi đã thay đổi nó thành ví dụ phù hợp hơn.
Tim

3
Biểu đồ thanh (hay còn gọi là "biểu đồ nổ") có tỷ lệ mực: thông tin cực kỳ cao.
Frank Harrell

Trích dẫn từ Hướng dẫn APA (Tôi chưa kiểm tra về ngữ cảnh) là lời khuyên chung tốt, nhưng bản thân nó không phải là một đối số trực tiếp để sử dụng biểu đồ hộp có liên quan một phần trong ngữ cảnh này. Tôi đồng ý, một cách tự nhiên, các ô vuông đó có thể rất hữu ích và thường bổ sung, và chúng rất thường được sử dụng, nhưng điểm đầu tiên của tôi vẫn còn.
Nick Cox

@NickCox Tôi không thể nói rằng tôi đồng ý với bạn, nhưng tôi vẫn sẽ xem xét boxplot để cung cấp thêm thông tin và không trùng lặp kết quả kiểm tra t ngay cả khi nó không liên quan trực tiếp đến kiểm tra t. Nó là đơn giản, rõ ràng và nhiều thông tin.
Tim

8

Đây chủ yếu là một biến thể về các câu trả lời hữu ích của @Tim và @gung, nhưng các biểu đồ không thể được đưa vào một nhận xét.

Điểm nhỏ nhưng có thể hữu ích:

  1. Một biểu đồ dải hoặc biểu đồ dấu chấm như được minh họa bởi @gung cần sửa đổi nếu có các mối quan hệ, như có trong dữ liệu ví dụ. Các điểm có thể được xếp chồng lên nhau hoặc bị xáo trộn, hoặc như trong ví dụ dưới đây, bạn có thể sử dụng một biểu đồ hộp lượng tử lai theo đề xuất của Emanuel Parzen (tham chiếu dễ tiếp cận nhất có lẽ là năm 1979. Mô hình dữ liệu thống kê phi tham số. Tạp chí, Hiệp hội thống kê Mỹ74: 105-121). Điều này cũng có những ưu điểm khác, nhấn mạnh rằng nếu một nửa dữ liệu nằm trong hộp thì một nửa cũng ở bên ngoài và hiển thị tất cả các chi tiết của phân phối. Khi chỉ có hai nhóm, như trong bối cảnh này, bất kỳ loại cốt truyện hộp thông thường nào cũng có thể là một màn hình hiển thị tối thiểu, thực sự là bộ xương. Một số người sẽ coi đó là một đức tính, nhưng có phạm vi để hiển thị chi tiết hơn. Đối số ngược lại là một ô vuông đánh dấu các điểm cụ thể, đáng chú ý là hơn 1,5 IQR từ phần tư gần hơn, là một cảnh báo rõ ràng cho người dùng: xem ra với bài kiểm tra t, vì có thể có các điểm trong đuôi mà bạn nên lo lắng về.

  2. Bạn có thể tự nhiên thêm một dấu hiệu của phương tiện vào một ô vuông, điều này thường được thực hiện. Thêm một điểm đánh dấu hoặc biểu tượng điểm khác nhau là phổ biến. Ở đây chúng tôi chọn dòng tham khảo.

nhập mô tả hình ảnh ở đây

Lô hộp định lượng cho người hút thuốc và người không hút thuốc. Các hộp hiển thị trung bình và tứ. Các đường ngang trong màu xanh hiển thị có nghĩa.

Ghi chú. Biểu đồ được tạo ra trong Stata. Đây là mã cho những người quan tâm. stripplotphải được cài đặt trước đó với ssc inst stripplot.

clear 
mat nonsmokers = (18,22,21,17,20,17,23,20,22,21)
mat smokers = (16,20,14,21,20,18,13,15,17,21)
local n = max(colsof(nonsmokers), colsof(smokers)) 
set obs `n' 
gen smokers = smokers[1, _n] 
gen nonsmokers = nonsmokers[1, _n] 
stripplot smokers nonsmokers, vertical cumul centre xla(, noticks) ///
xsc(ra(0.6 2.4)) refline(lcolor(blue)) height(0.5) box ///
ytitle(digit span score) yla(, ang(h)) mcolor(red) msize(medlarge) 

01+

nhập mô tả hình ảnh ở đây


1
+1, tôi đã có ý định xáo trộn dữ liệu, nhưng tôi chưa thể truy cập được. Tôi cũng đã nghĩ đến việc thêm các lô tiên tiến hơn, bao gồm các ô hộp lượng tử, các ô vĩ cầm, và các ô qq, nhưng cuối cùng tôi đã từ bỏ ý tưởng liệt kê các âm mưu hơn bao giờ hết.
gung - Phục hồi Monica

@gung Đủ công bằng; Thật không may hoặc may mắn thay, chủ đề có thể dễ dàng biến thành cách so sánh hai bản phân phối nói chung. Đối với ví dụ dữ liệu khác, biểu đồ có thể là một đối thủ cạnh tranh nghiêm trọng, v.v.
Nick Cox

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.