Cách hiển thị các thanh lỗi cho các thử nghiệm chéo (ghép nối)


19

Kịch bản sau đây đã trở thành Câu hỏi thường gặp nhất trong bộ ba điều tra viên (I), người đánh giá / biên tập viên (R, không liên quan đến CRAN) và tôi (M) là người tạo cốt truyện. Chúng ta có thể giả định rằng (R) là người đánh giá ông chủ y tế điển hình, người chỉ biết rằng mỗi âm mưu phải có thanh lỗi, nếu không thì đó là sai. Khi một nhà phê bình thống kê có liên quan, các vấn đề ít quan trọng hơn nhiều.

Kịch bản

Trong một nghiên cứu chéo dược lý điển hình, hai loại thuốc A và B được kiểm tra về tác dụng của chúng đối với mức glucose. Mỗi bệnh nhân được kiểm tra hai lần theo thứ tự ngẫu nhiên và theo giả định không mang theo. Điểm cuối chính là sự khác biệt giữa glucose (BA) và chúng tôi giả định rằng xét nghiệm t ghép đôi là đủ.

(I) muốn một âm mưu cho thấy mức glucose tuyệt đối trong cả hai trường hợp. Anh lo ngại mong muốn của các thanh lỗi và yêu cầu các lỗi tiêu chuẩn trong biểu đồ thanh. Chúng ta đừng bắt đầu cuộc chiến đồ thị thanh ở đây ._)

biểu đồ thanh và glucose SE cho hai phương pháp điều trị

(I): Điều đó không thể đúng. Các thanh trùng nhau, và ta có p = 0,03? Đó không phải là những gì tôi đã học được ở trường trung học.

(M): Chúng tôi có một thiết kế ghép nối ở đây. Các thanh lỗi được yêu cầu là hoàn toàn không liên quan, những gì được tính là SE / CI của các khác biệt được ghép nối, không được hiển thị trong cốt truyện. Nếu tôi có lựa chọn và không có quá nhiều dữ liệu, tôi sẽ thích cốt truyện sau

Các dòng tham gia hiển thị ghép nối, chấm các giá trị ban đầu

Đã thêm 1: Đây là âm mưu tọa độ song song được đề cập trong một số phản hồi

(M): Các dòng hiển thị ghép nối, và hầu hết các dòng tăng lên, và đó là ấn tượng đúng, bởi vì độ dốc là những gì được tính (ok, đây là phân loại, nhưng tuy nhiên).

(I): Hình ảnh đó thật khó hiểu. Không ai hiểu điều đó và nó không có thanh lỗi (R đang ẩn nấp).

(M): Chúng tôi cũng có thể thêm một âm mưu khác cho thấy khoảng tin cậy có liên quan của sự khác biệt. Khoảng cách từ đường zero cho ấn tượng về kích thước hiệu ứng.

(Tôi): Không ai làm điều đó

(R): Và nó lãng phí cây quý

(M): (Là một người Đức tốt): Vâng, điểm trên cây được lấy. Nhưng tôi vẫn sử dụng điều này (và không bao giờ được công bố) khi chúng tôi có nhiều phương pháp điều trị và nhiều tương phản.

khoảng tin cậy của sự khác biệt

Có gợi ý nào không? Mã R bên dưới, nếu bạn muốn tạo một cốt truyện.

# Graphics for Crossover experiments
library(ggplot2)
library(plyr)
theme_set(theme_bw()+theme(panel.margin=grid::unit(0,"lines")))
n = 20
effect = 5 
set.seed(4711)
glu0 = rnorm(n,120,30)
glu1 = glu0 + rnorm(n,effect,7)
dt = data.frame(patient = rep(paste0("P",10:(9+n))),              
                treatment = rep(c("A","B"), each=n),glucose = c(glu0,glu1))

dt1 = ddply(dt,.(treatment), function(x){
  data.frame(glucose = mean(x$glucose), se = sqrt(var(x$glucose)/nrow(x)) )})

tt = t.test(glucose~treatment,paired=TRUE,data=dt,conf.int=TRUE)
dt2 = data.frame(diff = -tt$estimate,low=-tt$conf.int[2], up=-tt$conf.int[1])
p = paste("p =",signif(tt$p.value,2))

png(height=300,width=300)
ggplot(dt1, aes(x=treatment, y=glucose, fill=treatment))+      
  geom_bar(stat="identity")+  
  geom_errorbar(aes(ymin=glucose-se, ymax=glucose+se),size=1., width=0.3)+
  geom_text(aes(1.5,150),label=p,size=6)

ggplot(dt,aes(x=treatment,y=glucose, group=patient))+ylim(0,190)+
  geom_line()+geom_point(size=4.5)+
  geom_text(aes(1.5,60),label=p,size=6)

ggplot(dt2,aes(x="",y=diff))+
  geom_errorbar(aes(ymin=low,ymax=up),size=1.5,width=0.2)+ 
  geom_text(aes(1,-0.8),label=p,size=6)+
  ylab("95% CI of difference glucose B-A")+  ylim(-10,10)+
  theme(panel.border=element_blank(), panel.grid.major.x=element_blank(),
         panel.grid.major.y=element_line(size=1,colour="grey88"))

dev.off()

Ôi trời ơi @ dieter-menne, câu hỏi tuyệt vời! Nó phụ thuộc vào loại tạp chí mà bạn gửi bài viết. Tôi sẽ tránh xa các cuộc chiến đồ thị, nhưng tôi thích đồ thị 2 và 3: rất nhiều thông tin trong không gian quá nhỏ.
doug.numbers

4
Masson và Loftus (2003) là một tài liệu tham khảo được đưa ra. Chúng hiển thị các ô mẫu trong đó chúng điều khiển CI về sự khác biệt trong bảng thứ hai của cùng một biểu đồ. Liệu điều đó có làm cho tất cả mọi người trong rạp xiếc hạnh phúc mà tôi không biết (mặc dù tôi cảm thấy cho bạn!)
Andy W

Cảm ơn, @AndyW, đã tham khảo. Đó là vấn đề, nhưng có một vấn đề: đó là từ tâm lý học. Có nhiều bài báo hay hơn về chủ đề này từ các nhà tâm lý học có nền tảng thống kê tốt hơn nhiều so với các nhà phê bình y tế. Tôi ước tôi có thể tìm thấy một số hướng dẫn của tạp chí cấp cao về chủ đề này, đó là thanh kiếm sắc bén duy nhất tôi có thể xử lý.
kiêng Menne

Câu trả lời:


17

Bạn hoàn toàn chính xác trong giả định của mình rằng các thanh lỗi đại diện cho lỗi tiêu chuẩn của giá trị trung bình là hoàn toàn không phù hợp cho các thiết kế bên trong chủ đề. Tuy nhiên, câu hỏi về các thanh lỗi và ý nghĩa chồng chéo là một chủ đề khác, mà tôi sẽ trở lại ở cuối danh sách tham khảo nhận xét này.

Có tài liệu phong phú từ Tâm lý học về các khoảng tin cậy bên trong chủ đề hoặc các thanh lỗi làm chính xác những gì bạn muốn. Các tài liệu tham khảo rõ ràng:

Gác xép, GR, & Masson, MEJ (1994). Sử dụng khoảng tin cậy trong các thiết kế bên trong chủ đề . Bản tin & Đánh giá tâm lý , 1 (4), 476 Hay490. doi: 10.3758 / BF03210951

Tuy nhiên, vấn đề của họ là họ sử dụng cùng một thuật ngữ lỗi cho tất cả các cấp độ của một yếu tố bên trong chủ đề. Đây dường như không phải là một vấn đề lớn đối với trường hợp của bạn (2 cấp độ). Nhưng có nhiều cách tiếp cận hiện đại hơn giải quyết vấn đề này. Đáng chú ý nhất:

Franz, V., & Gác xép, G. (2012). Lỗi tiêu chuẩn và khoảng tin cậy trong thiết kế bên trong chủ đề: Tổng quát hóa Loftus và Masson (1994) và tránh sự sai lệch của các tài khoản thay thế . Bản tin & Đánh giá tâm lý , 1 trận10. doi: 10.3758 / s13423-012-0230-1

Baguley, T. (2011). Tính toán và vẽ đồ thị trong khoảng tin cậy của đối tượng cho ANOVA. Phương pháp nghiên cứu hành vi . doi: 10.3758 / s13428-011-0123-7 [ có thể tìm thấy ở đây ]

Tài liệu tham khảo thêm có thể được tìm thấy trong hai bài báo sau (mà tôi nghĩ là cả hai đều đáng đọc).


Làm thế nào để các nhà nghiên cứu giải thích các TCTD? Xấu theo giấy sau:

Belia, S., Fidler, F., Williams, J., & Cumming, G. (2005). Các nhà nghiên cứu hiểu sai về khoảng tin cậy và các thanh lỗi tiêu chuẩn . Phương pháp tâm lý , 10 (4), 389 bóng394. doi: 10.1037 / 1082-989X.10.4.389

Làm thế nào chúng ta nên giải thích các TCTD chồng chéo và không chồng chéo?

Cumming, G., & Finch, S. (2005). Suy luận bằng mắt: Khoảng tin cậy và cách đọc hình ảnh của dữ liệu . Nhà tâm lý học người Mỹ , 60 (2), 170 trừ180. doi: 10.1037 / 0003-066X.60.2.170


Một suy nghĩ cuối cùng (mặc dù điều này không liên quan đến trường hợp của bạn): Nếu bạn có thiết kế chia ô (nghĩa là các yếu tố bên trong và giữa các chủ đề) trong một âm mưu, bạn có thể quên tất cả các thanh lỗi. Tôi sẽ (khiêm tốn) khuyên của tôi raw.means.plotchức năng trong gói R plotrix.


2
Danh sách tham khảo rất hữu ích. Cumming đã tập hợp nhiều ý tưởng của mình lại với nhau trên amazon.com/Under Hiểu-New -Statistic-Meta -Analysis-book / dp / giả (Dù bạn muốn nói gì về biểu thức "số liệu thống kê mới", tôi có thể đồng ý.)
Nick Cox


@amoeba Bài báo Baguley tôi trích dẫn sử dụng kỹ thuật giấy Morey.
Henrik

10

Câu hỏi dường như không liên quan đến các thanh lỗi nhiều về các cách tốt nhất để vẽ đồ thị dữ liệu được ghép nối.

Về bản chất, các thanh lỗi ở đây nhiều nhất là một cách tóm tắt sự không chắc chắn: chúng không, và chúng nhất thiết không thể, nói nhiều về bất kỳ cấu trúc tốt nào trong dữ liệu.

Các lô phối hợp song song - đôi khi được gọi là sơ đồ hồ sơ, một thuật ngữ có nghĩa là những thứ khác nhau trong các lĩnh vực khác nhau - đã được đề cập trong câu hỏi. Các sơ đồ phân tán cơ bản đã được đề xuất bởi @Ray Koopman.

Một-B(Một+B)/2Một+B

Một nguồn khác cho âm mưu này là Neyman, J., Scott, EL và Shane, CD 1953. Về sự phân bố không gian của các thiên hà: một mô hình cụ thể. Tạp chí vật lý thiên văn 117: 92 Hàng133.

Theo nghĩa rộng, những mảnh đất như vậy giống với ý tưởng về âm mưu còn lại so với trang bị, cũng được phổ biến bởi Tukey và anh rể Anscombe bình phương.

Một-B= =0Một= =BMộtB

Một thiết kế bị bỏ qua là sơ đồ song song của McNeil, DR 1992. Trên dữ liệu ghép đồ thị. Thống kê người Mỹ 46: 307 Kho 310. Điều này cũng được thảo luận trong hai tài liệu tham khảo dưới đây.

Các đánh giá liên kết với Stata, với một số tài liệu tham khảo, nằm trong

2004, Vẽ đồ thị thỏa thuận và bất đồng. Tạp chí Stata 4: 329-349.

.pdf có thể truy cập tại http://www.stata-journal.com/sjpdf.html?articlenum=gr0005

Các sơ đồ được ghép nối, song song hoặc hồ sơ để thay đổi, tương quan và so sánh khác. Tạp chí Stata 9: 621-639.

.pdf có thể truy cập tại http://www.stata-journal.com/sjpdf.html?articlenum=gr0041

Người dùng không phải là Stata có thể bỏ qua và tìm đường đi qua mã Stata trong khi tìm ra cách triển khai các biểu đồ trong phần mềm yêu thích của riêng họ.

MộtB


4

Hãy thử một biểu đồ phân tán các điểm riêng lẻ (A, B). Hầu hết chúng chỉ nên nằm ở một bên của đường chéo (đường A = B). Có hai tương tự của các thanh lỗi. Loại thông thường, tương đương với CI cho chênh lệch trung bình, sẽ là dải tin cậy cho chênh lệch trung bình. Dải sẽ là vùng giữa hai đường thẳng, cả hai đường thẳng song song với đường chéo. Một thử nghiệm t được ghép nối sẽ có ý nghĩa nếu và chỉ khi cả hai cạnh của dải nằm cùng một phía của đường chéo.

Một tương tự thanh lỗi bảo thủ hơn sẽ là một hình elip tự tin cho trung tâm.


1
cmethodBcmethodMột

Không, cl. - :) Hóa lâm sàng quá phức tạp. Có thể là bạn đã thêm một số tài liệu tham khảo trong "có"; Tôi không chắc chắn những gì bạn đang nói về giấy.
kiêng Menne

4

Tóm tắt sơ bộ:

Masson / Loftus rất toàn diện, và không dễ đọc để gửi cho các đồng nghiệp y tế của tôi, những người không chấp nhận một cái gì đó như "tương tác". Họ cũng có một số gợi ý cho nhiều so sánh, điều này cho thấy khoảng tin cậy theo cặp rất khó để minh họa khi người ta không muốn đơn giản hóa nhiều.

Gác xép Masson

Tôi không thích phong cách này: các thanh có thanh lỗi nhìn vào thiên niên kỷ Excelish. Tuy nhiên, họ cũng sử dụng một phong cách thanh lịch hơn một chút:

Masson Loftus không có thanh

Cumming / FinchBelia et al. phải đọc. Đầu tiên là sự lựa chọn hoàn hảo để cho người bạn của bạn rùng mình khi anh ấy nhìn thấy sự tương tác từ . Tôi đã đặt hàng cuốn sách của Cumming sau khi đọc bài báo đó. Phần thứ hai cho thấy một bài kiểm tra tôi sẽ thực hiện trong Shiny cho cuộc họp điều tra viên y tế tiếp theo.

Cumming / Finch

Tôi thích cốt truyện này, ngay cả khi có một trục thứ hai mà tôi chưa từng sử dụng trước đây; kiểm tra sự đóng góp của Henrik và một số người khác trên StackOverflow để biết phương pháp đồ họa cơ sở R để có được nó. Tôi muốn đặt trục thứ hai ở bên trái của sự khác biệt để làm rõ hoàn toàn rằng các giá trị đã thay đổi và có thể thêm trục giá trị p.

Bất cứ ai từ phần mạng / ggplot chụp ảnh? Tất cả các giải pháp được cung cấp là đồ họa cơ bản và không thể điều chỉnh / có thể điều chỉnh được.

Tuy nhiên: lưu ý rằng các nhận xét và bài viết chủ yếu là từ bộ phận tâm lý học (và @cbeleites từ hóa học khó tính). Nó sẽ là tốt để có được ý kiến ​​từ các nhà phê bình của các tạp chí y tế.


0

Tại sao không chỉ vẽ sự khác biệt * cho mỗi bệnh nhân? Sau đó, bạn có thể sử dụng biểu đồ, biểu đồ hình hộp hoặc biểu đồ xác suất bình thường và phủ lên khoảng tin cậy 95% cho sự khác biệt.

  • Trong một số tình huống, nó có thể là sự khác biệt của logarit. Xem, ví dụ, Patterson & Jones, "Tương đương sinh học và thống kê trong dược lâm sàng", Chapman, 2006.

Tại sao không? Nó có thể cung cấp thông tin hợp lệ, nhưng các lô với các điểm hoặc cặp riêng lẻ không thực sự phổ biến trong nghiên cứu y học. Đó là lý do tại sao cốt truyện song song (cung cấp thêm thông tin) rất phổ biến. Các nhà nghiên cứu y tế muốn trung bình và "phạm vi bình thường" (bất kể đó là gì).
kiêng Menne
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.