Kiểm tra thống kê để so sánh độ chính xác của hai thiết bị


10

Tôi đang so sánh hai thiết bị kiểm soát nhiệt độ cả hai được thiết kế để duy trì nhiệt độ cơ thể ở chính xác 37 độ ở bệnh nhân gây mê. Các thiết bị được trang bị cho 500 bệnh nhân tạo thành hai nhóm. Nhóm A (400 bệnh nhân) - Thiết bị 1, Nhóm B (100 bệnh nhân) - Thiết bị 2. Mỗi bệnh nhân được đo nhiệt độ một lần mỗi giờ trong 36 giờ, cho tôi 18000 điểm dữ liệu trên hai nhóm. Tôi cần xác định thiết bị nào kiểm soát nhiệt độ cơ thể của bệnh nhân chính xác hơn trong khoảng thời gian 36 giờ. Tôi đã xây dựng các biểu đồ đường nối các giá trị trung bình tại mỗi thời điểm với các thanh tứ phân và trực quan dường như có một sự khác biệt. Làm thế nào tôi nên phân tích dữ liệu của mình để chứng minh sự khác biệt thống kê?


Bạn đã chia sẻ bệnh nhân giữa các thiết bị? Nếu bạn đã không thì phải có một giả định bổ sung rằng các bệnh nhân ở hai nhóm tương tự nhau theo nghĩa rộng.
Aksakal

Một mô hình hiệu ứng hỗn hợp thì sao? Theo một nghĩa nào đó, các lỗi tiêu chuẩn cho từng cấp độ (nhóm A / B) sẽ cho bạn biết các phép đo chính xác đến mức nào. Bạn có thể tính đến chuỗi thời gian và bệnh nhân.
Roman Luštrik

Câu trả lời:


2

Điều đầu tiên bạn sẽ cần nghĩ đến là ý nghĩa của nó (định lượng) để có "độ chính xác tốt" trong một thiết bị như vậy. Tôi sẽ đề nghị rằng, trong bối cảnh y tế, mục tiêu là để tránh sự sai lệch nhiệt độ đi vào phạm vi nguy hiểm cho bệnh nhân, vì vậy "độ chính xác tốt" có lẽ sẽ chuyển thành tránh nhiệt độ thấp hoặc cao nguy hiểm. Điều này có nghĩa là bạn sẽ tìm kiếm một số liệu xử phạt nhiều sai lệch lớn so với nhiệt độ tối ưu của bạn là 37 C. Theo quan điểm này, đo lường dựa trên biến động của nhiệt độ trung bình sẽ là một biện pháp tồi độ chính xác, trong khi các biện pháp làm nổi bật độ lệch lớn sẽ tốt hơn.o

Khi bạn đang xây dựng loại số liệu này, bạn đang hoàn toàn áp dụng "chức năng phạt" để xử phạt nhiệt độ lệch khỏi nhiệt độ mong muốn của bạn. Một lựa chọn sẽ là đo "độ chính xác" bằng phương sai thấp hơn xung quanh nhiệt độ mong muốn (coi đây là giá trị trung bình cố định để tính toán phương sai). Phương sai bị phạt bởi lỗi bình phương, do đó đưa ra hình phạt hợp lý cho độ lệch cao. Một lựa chọn khác sẽ là phạt nặng hơn (ví dụ, lỗi hình khối). Một lựa chọn khác là chỉ đơn giản là đo thời gian mỗi thiết bị có bệnh nhân nằm ngoài phạm vi nhiệt độ an toàn về mặt y tế. Trong mọi trường hợp, bất cứ điều gì bạn chọn phải phản ánh những nguy hiểm nhận thấy của sai lệch so với nhiệt độ mong muốn.

Khi bạn đã xác định được cái gì tạo thành một số liệu "độ chính xác tốt", bạn sẽ hình thành một loại "kiểm tra độ không đồng nhất", được xây dựng theo nghĩa rộng hơn là cho phép bất kỳ thước đo chính xác nào bạn đang sử dụng. Tôi không chắc chắn tôi đồng ý với nhận xét của người điều chỉnh về tự động tương quan. Nó thực sự phụ thuộc vào công thức tổn thất của bạn - xét cho cùng, ở trong một phạm vi nhiệt độ cao trong một thời gian dài có thể chính xác là điều nguy hiểm nhất, vì vậy nếu bạn điều chỉnh lại để tính tương quan tự động, bạn có thể kết thúc không đủ khả năng để xử phạt các kết quả rất nguy hiểm.


0

Đây là một bài kiểm tra về homoscedasticity. Và bởi vì đây là một chuỗi thời gian, sự lựa chọn thích hợp là bài kiểm tra BreuschTHER Pagan , không phải bài kiểm tra F. Bài kiểm tra này chỉ trả lời câu hỏi về sự bình đẳng về độ chính xác giữa hai thiết bị. Mức độ chính xác là một cách nghĩ khác về phương sai.

[Chỉnh sửa: Thay đổi bài kiểm tra thành đúng, xem xét sự phụ thuộc thời gian]


3
Cách tiếp cận này là hợp lý. Nhưng tại sao không hoàn thành cả hai mục tiêu trực tiếp, bằng cách so sánh sự phân tán xung quanh nhiệt độ mục tiêu hơn là phương sai (chỉ đo sự phân tán xung quanh nhiệt độ trung bình)? Một vấn đề quan trọng để kiểm tra mối quan hệ đầu tiên liên quan: nếu nó ở mức cao, thì cần phải thực hiện một số hiệu chỉnh (chẳng hạn như giảm mức độ tự do trong các thử nghiệm). Một vấn đề khác liên quan đến mất mát : chức năng mất có thể không phải là bậc hai. Có lẽ mọi người có thể dễ dàng chịu đựng những dao động nhỏ nhưng sự xuất hiện của một biến động lớn có thể gây tổn thương. Điều đó nên được khám phá.
whuber

@whuber Về việc so sánh xung quanh temp đích, nếu là tôi, đó chính xác là những gì tôi sẽ làm. OP đặc biệt chỉ hỏi câu hỏi về phương sai, vì vậy bất kể khuynh hướng của chúng ta là gì, chúng ta phải giải quyết trực tiếp, đúng không? :)
Gary Chung

2
Vấn đề đối với bài kiểm tra F sẽ không phải là sự bình thường, nó có thể sẽ là sự độc lập. Đây là chuỗi thời gian.
Glen_b -Reinstate Monica

@Glen_b Không thể tin rằng tôi đã bỏ lỡ điểm đó. Cảm ơn bạn đã nắm bắt điều đó. Đã chỉnh sửa.
Gary Chung

9
Với sự tôn trọng, không: sự khác biệt giữa trang web này và, giả sử, trang Toán học là một phần đáng kể trong việc trả lời một câu hỏi thống kê liên quan đến việc giúp OP đóng khung nó như họ dự định. Rất thường xuyên, câu trả lời chính xác cho các câu hỏi như được hỏi ban đầu ở đây là ít hữu ích hoặc thậm chí sai lệch. Vì vậy, nhiệm vụ đầu tiên của chúng tôi là những người đọc tích cực và những người được hỏi sẽ là xác định rằng chúng tôi đang diễn giải câu hỏi theo cách hữu ích và phù hợp và cung cấp câu trả lời giải quyết tốt nhất các mục tiêu của OP. Sử dụng ý kiến ​​cho câu hỏi để đặt câu hỏi làm rõ và xác minh giải thích của bạn.
whuber

0

Nếu bạn quan tâm đến việc các thiết bị duy trì nhiệt độ 37C tốt như thế nào, bạn có thể:

  1. Sử dụng tất cả dữ liệu có sẵn từ mỗi người như là hoặc
  2. Ước tính độ lệch trung bình trên mỗi người từ 37C bằng 36 thử nghiệm của mỗi người.

Các dữ liệu tự nhiên cho vay để điều trị lặp đi lặp lại. Bằng cách coi các thử nghiệm giữa người với tư cách là các cụm, bạn sẽ giảm khả năng khoảng tin cậy được ước tính sai lệch xung quanh hiệu quả của thiết bị. Ngoài ra, bạn có thể kiểm tra ảnh hưởng của thời gian giữa cả hai thiết bị hoặc dưới dạng tương tác với thiết bị để xác định xem việc duy trì nhiệt độ theo thời gian có tốt không. Tìm cách để hình dung tất cả những điều này có tầm quan trọng chính và có thể gợi ý một cách tiếp cận khác. Một cái gì đó dọc theo dòng:

library(dplyr)
library(lme4)

set.seed(42)
id <- rep(1:500, each=36)
time <- rep(1:36,500)
temp <- c(rnorm(36*400, 38,0.5), rnorm(36*100,37.25,0.5))
temp <- temp + 1/time

prox_37 <- temp - 37
group <- c(rep("A",36*400), rep("B",36*100))
graph_t <- ifelse(group=="A", time-0.25, time+0.25)
df <- data.frame(id,time,temp,prox_37,group, graph_t)

id_means <- group_by(df, id) %>% summarize(mean_37 = mean(prox_37))
id_means$group <- c(rep("A",400), rep("B",100))

boxplot(id_means$mean_37 ~ id_means$group)

plot(graph_t, prox_37, col=as.factor(group))
loess_fit <- loess(prox_37 ~ time, data = df)
lines(c(1:36), predict(loess_fit, newdata= c(1:36)) , col = "blue")

summary(t.test(mean_37 ~group, data=id_means))

model1 <- glm(prox_37 ~ as.factor(group), family = "gaussian", data=df)
model2 <- lmer(prox_37 ~ as.factor(group) + (1 | id), data=df)
model3 <- lmer(prox_37 ~ as.factor(group) + time + (1 | id), data=df)
model4 <- lmer(prox_37 ~ as.factor(group) + time + time*as.factor(group) + (1 | id), data=df)

AIC(model1)
summary(model2)
summary(model3)
summary(model4)

nhập mô tả hình ảnh ở đây

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.