Các -test vs -test để so sánh tỷ lệ cược của cảm lạnh trong 2 nhóm


12

Tôi chỉ đọc trên một tạp chí khoa học khá phổ biến (phổ biến) (Thủ tướng Đức, 02/2013, tr.36) về một thí nghiệm thú vị (không có nguồn, thật không may). Nó thu hút sự chú ý của tôi bởi vì bằng trực giác tôi đã nghi ngờ về tầm quan trọng của kết quả, nhưng thông tin được cung cấp là đủ để tái tạo thử nghiệm thống kê.

Các nhà nghiên cứu tự hỏi liệu việc bị lạnh trong thời tiết lạnh có làm tăng tỷ lệ mắc cảm lạnh hay không. Vì vậy, họ ngẫu nhiên chia một nhóm 180 sinh viên thành hai nhóm. Một nhóm phải giữ chân họ trong nước lạnh trong 20 phút. Người kia giữ giày của họ trên. Một kiểu thao túng buồn cười, tôi nghĩ vậy, nhưng mặt khác tôi không phải là bác sĩ và có lẽ bác sĩ nghĩ buồn cười. Vấn đề đạo đức sang một bên.

Dù sao, sau 5 ngày, 13 học sinh trong nhóm điều trị bị cảm, nhưng chỉ có 5 người trong nhóm giữ giày. Tỷ lệ cược của thí nghiệm này là 2,87.

Với kích thước mẫu khá nhỏ, tôi bắt đầu tự hỏi liệu sự khác biệt này có thể là đáng kể. Vì vậy, tôi đã tiến hành hai bài kiểm tra.

Đầu tiên một bài kiểm tra đơn giản về sự bằng nhau của tỷ lệ bằng cách sử dụng xấp xỉ bình thường. Bài kiểm tra này có với . Tôi đoán rằng đây là những gì các nhà nghiên cứu đã thử nghiệm. Đây thực sự chỉ là đáng kể. Tuy nhiên, kiểm tra z này chỉ có giá trị trong các mẫu lớn, nếu tôi không nhầm, do xấp xỉ bình thường. Hơn nữa, tỷ lệ lưu hành khá nhỏ và tôi tự hỏi liệu điều này có thể không ảnh hưởng đến tỷ lệ bao phủ của khoảng tin cậy của hiệu ứng.z=1.988p=0.0468

Vì vậy, lần thử thứ hai của tôi là một thử nghiệm độc lập chi bình phương, cả với mô phỏng Monte-Carlo và Pearson Chi-vuông tiêu chuẩn. Ở đây tôi tìm thấy giá trị cả về .p=.082

Bây giờ tất cả không quá yên tâm về kết quả. Tôi tự hỏi liệu có nhiều lựa chọn hơn để kiểm tra dữ liệu này không và suy nghĩ của bạn về hai bài kiểm tra là gì (đặc biệt là các giả định của bài kiểm tra đầu tiên, quan trọng,)


Tôi tin rằng bạn đã thực hiện một sự điều chỉnh liên tục trên thống kê chi bình phương của Pearson, tính đến sự khác biệt về giá trị p.
Scortchi - Phục hồi Monica

Câu trả lời:


13

Tôi sẽ sử dụng phép thử hoán vị thay vì xấp xỉ Bình thường hoặc bình phương chi. Các thử nghiệm hoán vị là chính xác và mạnh mẽ nhất, có điều kiện dựa trên dữ liệu.

Trong trường hợp này, chúng tôi không thể tính toán tất cả các hoán vị của các nhóm, nhưng chúng tôi có thể tạo ra rất nhiều hoán vị ngẫu nhiên của dữ liệu và nhận được một giá trị khá chính xác:

group <- c(rep("A",90),rep("B",90))
n_a <- rep(0,100000)
for (i in 1:length(n_a)) {
   temp <- sample(group, size=18)
   n_a[i] <- sum(temp == "A")
}
> mean(n_a >= 13)
[1] 0.03904

trong đó sẽ chỉ ra giá trị p là 0,039.

TUY NHIÊN, và đây là một vấn đề lớn, tôi đoán rằng giả định rằng các đối tượng bị cảm lạnh là các sự kiện độc lập bị vi phạm. Những cá nhân này là sinh viên, có lẽ ở cùng một trường. Hãy tưởng tượng hai người trong số họ chia sẻ một lớp học, hoặc ký túc xá, hoặc một số hoạt động khác, hoặc một quán ăn tự phục vụ (trong một trường học có nhiều nhà ăn); các sự kiện "# 1 bị cảm lạnh" và "# 2 bị cảm lạnh" không độc lập. Tôi có thể tưởng tượng rằng một sinh viên sẽ nói "hãy đăng ký thử nghiệm này!" cho bạn cùng phòng hoặc bạn bè của anh ấy / cô ấy; Tôi có thể tưởng tượng rằng các sinh viên được tuyển dụng từ các lớp học mà các giáo sư đã dạy; Tôi có thể tưởng tượng rất nhiều cách mà giả định độc lập bị vi phạm. Có lẽ bài báo mà tôi chưa đọc, đề cập đến một số trong số này, nhưng thật khó để xem làm thế nào nó có thể giải quyết tất cả chúng,


Cảm ơn @jbowman - ngoài ra bạn đã tiến hành kiểm tra một phía, tôi thấy. Tôi nghĩ rằng điều này có ý nghĩa hơn sau đó hai bài kiểm tra hai bên tôi đã sử dụng. Nếu xấp xỉ bình thường được thực hiện một phía, các giá trị p là 0,23 ở trên. Tôi thích bài thơ về sự độc lập. Có lẽ các sinh viên cũng không bị cô lập khi họ giữ chân họ xuống nước, vì vậy đó cũng là một cách truyền cảm lạnh.
tomka

(+1) Nhưng điều đáng chú ý là bạn không cần phải mô phỏng: phân phối thống kê kiểm tra của bạn tuân theo phân phối siêu bội theo giả thuyết null (& điều chỉnh trên tổng số biên). Đây là thử nghiệm chính xác của Fisher.
Scortchi - Tái lập Monica

11

@jbowman đã cho bạn một lựa chọn tốt. Tôi nghĩ tôi có thể cung cấp một số thông tin liên quan đến câu hỏi rõ ràng về sự phù hợp của -test so với các χ 2 thử nghiệm. zχ2

-test:z

zzt

tzz

N91×91=1,729, đó là rất nhiều khả năng. Với một tập dữ liệu nhỏ, bạn thực sự có thể gặp phải một số loại vấn đề tôi thảo luận trong câu trả lời được liên kết của mình, nhưng với , bạn không có quá nhiều điều phải lo lắng. Tôi tin rằng -test là một lựa chọn hợp lệ cho các nhà nghiên cứu. N=180z

χ2 -test:

Nhưng còn -test thì sao? Tôi nghĩ đó cũng là một lựa chọn hợp lệ, nhưng nó không phải là lựa chọn đầu tiên của tôi. (Tôi xin lưu ý rằng việc quan tâm thứ hai đã thảo luận ở trên - sự không phù hợp giữa dữ liệu rời rạc và phân phối tham chiếu liên tục - áp dụng tương tự như đối với -test như đối với -test, do đó, có không có lợi thế ở đây.) Vấn đề vớiχ2χ2zχ2-test là nó không cho rằng có bất kỳ điều gì đặc biệt về tổng số cột liên quan đến tổng số hàng; cả hai đều được đối xử như thể chúng có thể là các giá trị khác có thể. Tuy nhiên, điều này không phản ánh chính xác các thiết lập thử nghiệm. Có 180 người, và 90 người được chỉ định cho mỗi nhóm. Điều duy nhất thực sự khác nhau giữa các nghiên cứu giống hệt nhau lặp đi lặp lại là số người bị cảm lạnh trong mỗi nhóm. Các -test sai xử lý cả số lượng cảm lạnh và số lượng người trong mỗi nhóm như thể họ có thể thay đổi, nhưng -test làm cho các giả định đúng đắn. Đó là lý do tại sao -test có nhiều sức mạnh hơn ở đây. χ2zz

zχ2


Cảm ơn bạn @gung, tôi thực sự đánh giá cao những nỗ lực của bạn. Nó làm cho mọi thứ rõ ràng hơn.
tomka

@gung tôi bối rối - chi vuông và z có tỷ lệ giống nhau hay không? stats.stackexchange.com/questions/173415/ Mạnh
Xavier Bourret Sicotte

@XavierBourretSicotte, z-test thường được triển khai dưới mui xe như một thử nghiệm chi bình phương, R làm điều đó chẳng hạn. Tôi vẫn thường thích sử dụng kiểm tra z vì thông tin được trình bày theo cách phù hợp với cách hiểu rằng 1 biến là một biến số và biến còn lại là phản hồi.
gung - Phục hồi Monica

1
(+1) @XavierBourretSicotte: Có hai phép thử z thường được sử dụng cho sự khác biệt giữa hai tỷ lệ: một là kiểm tra điểm, tương đương với kiểm tra chi bình phương của Pearson (trong đó phương sai của mẫu số được tính theo mức phù hợp nhất vô giá trị); khác là một thử nghiệm Wald (trong đó phương sai của mẫu số được tính theo ước tính khả năng tối đa của sự khác biệt trong hai tỷ lệ).
Scortchi - Phục hồi Monica

@Scortchi cảm ơn vì đã làm rõ điều này! Đây là lần đầu tiên tôi bắt gặp một lời giải thích rõ ràng về sự khác biệt - bạn có thể liên kết đến những nơi mà hai cách tiếp cận được giải thích không? Với các công thức tương ứng cho phương sai?
Xavier Bourret Sicotte
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.