Lỗi loại I nói chung khi liên tục kiểm tra dữ liệu tích lũy


12

Tôi có một câu hỏi về phương pháp tuần tự nhóm .

Theo Wikipedia:

Trong một thử nghiệm ngẫu nhiên với hai nhóm điều trị, thử nghiệm tuần tự nhóm cổ điển được sử dụng theo cách sau: Nếu có n đối tượng trong mỗi nhóm, phân tích tạm thời được thực hiện trên 2n đối tượng. Phân tích thống kê được thực hiện để so sánh hai nhóm, và nếu giả thuyết thay thế được chấp nhận, thử nghiệm kết thúc. Mặt khác, thử nghiệm tiếp tục cho 2n đối tượng khác, với n đối tượng mỗi nhóm. Phân tích thống kê được thực hiện lại trên các đối tượng 4n. Nếu sự thay thế được chấp nhận, thì thử nghiệm kết thúc. Mặt khác, nó tiếp tục với các đánh giá định kỳ cho đến khi N bộ 2n đối tượng có sẵn. Tại thời điểm này, thử nghiệm thống kê cuối cùng được tiến hành và thử nghiệm bị ngừng

Nhưng bằng cách liên tục kiểm tra dữ liệu tích lũy theo kiểu này, mức độ lỗi loại I bị tăng cao ...

Nếu mẫu là độc lập với nhau, loại nhìn chung, tôi lỗi, , sẽ làα

α= =1-(1-α)k

Trong đó là cấp độ của mỗi thử nghiệm và k là số lượng hình ảnh tạm thời.αk

Nhưng các mẫu không độc lập vì chúng trùng nhau. Giả sử các phân tích tạm thời được thực hiện ở các mức tăng thông tin bằng nhau, có thể thấy rằng (slide 6)

nhập mô tả hình ảnh ở đây

Bạn có thể giải thích cho tôi làm thế nào bảng này có được?

Câu trả lời:


12

Các slide sau, thông qua 14, giải thích ý tưởng. Điểm, như bạn lưu ý, là chuỗi thống kê có tương quan.

z1Φz21/2(z1,z2)c= =Φ-1(1-0,05/2)α|z1|>c|z1|c|z2|>c

Đồ họa này mô tả pdf nhị phân và khu vực tích hợp (bề mặt rắn). PDF bất thường, cốt truyện bề mặt 3D


Hiểu rồi, cảm ơn bạn! Là tương quan cor (z1, z2) khó thu được?
ocram

@ Marco, Sự tương quan rất đơn giản để tính toán vì thống kê kiểm tra rất đơn giản: đó là sự kết hợp tuyến tính của các biến thông thường. (Điều này là do chúng tôi giả sử phương sai được biết đến.) Ngoài ra, bạn có thể nghĩ về thống kê thứ hai là tổng của hai biến ngẫu nhiên độc lập: biến thứ nhất,z1, cộng với thay đổi được tạo bởi dữ liệu bổ sung, z1-z2. Trong các trường hợp phức tạp hơn, mối tương quan có thể khá khó tính: đó là một lý do tình huống hơi lý tưởng hóa này được sử dụng để thúc đẩy các bài kiểm tra tuần tự!
whuber

Cảm ơn rât nhiều. Vâng, mối tương quan trông khá dễ dàng để tính toán. Trên thực tế, tôi không rõ ràng rằng bối cảnh là một so sánh về phương tiện của hai phân phối bình thường. Bây giờ, nó là rõ ràng và bạn làm cho mọi thứ khác rất rõ ràng là tốt! Cảm ơn bạn!
ocram

bạn có thể cung cấp một công thức (hoặc mã R) làm thế nào để tính toán điều này cho ví dụ n = 400 không? Tôi sẽ làm điều này một mình nhưng tiếc là tôi không biết làm thế nào. Và tôi phải điều chỉnh công thức như thế nào nếu tôi muốn tính tỷ lệ lỗi chung nếu tôi có nhiều phép so sánh (ví dụ: so sánh 4 tỷ lệ) và không thực hiện chỉnh sửa như Bonferroni và thực hiện các bài kiểm tra lặp lại? Bạn có thể giúp tôi với điều đó?
Andreas
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.