Nói rằng tôi muốn biết cỡ mẫu tôi cần cho một thử nghiệm mà tôi đang tìm cách xác định xem sự khác biệt về hai tỷ lệ thành công có ý nghĩa thống kê hay không. Đây là quy trình hiện tại của tôi:
- Nhìn vào dữ liệu lịch sử để thiết lập dự đoán cơ bản. Nói rằng trong quá khứ, thực hiện một hành động dẫn đến tỷ lệ thành công 10% trong khi không thực hiện một hành động dẫn đến tỷ lệ thành công 9%. Giả sử rằng những kết luận này chưa được xác thực về mặt thống kê nhưng chúng dựa trên lượng dữ liệu tương đối lớn (hơn 10.000 quan sát).
Cắm các giả định này vào power.prop.test để có được những điều sau đây:
power.prop.test(p1=.1,p2=.11,power=.9) Two-sample comparison of proportions power calculation n = 19746.62 p1 = 0.1 p2 = 0.11 sig.level = 0.05 power = 0.9 alternative = two.sided
Vì vậy, điều này cho tôi biết rằng tôi sẽ cần cỡ mẫu ~ 20000 trong mỗi nhóm thử nghiệm A / B để phát hiện sự khác biệt đáng kể giữa các tỷ lệ.
Bước tiếp theo là thực hiện thí nghiệm với 20.000 quan sát trong mỗi nhóm. Nhóm B (không có hành động nào) có 2300 thành công trong số 20.000 quan sát, trong khi nhóm A (thực hiện hành động) có 2200 thành công trong số 20.000 quan sát.
Làm một prop.test
prop.test(c(2300,2100),c(20000,20000)) 2-sample test for equality of proportions with continuity correction data: c(2300, 2100) out of c(20000, 20000) X-squared = 10.1126, df = 1, p-value = 0.001473 alternative hypothesis: two.sided 95 percent confidence interval: 0.003818257 0.016181743 sample estimates: prop 1 prop 2 0.115 0.105
Vì vậy, chúng tôi nói rằng chúng tôi có thể bác bỏ giả thuyết khống rằng tỷ lệ là bằng nhau.
Câu hỏi
- Là phương pháp này âm thanh hoặc ít nhất là đi đúng hướng?
- Tôi có thể chỉ định
alt="greater"
trên prop.test và tin tưởng vào giá trị p mặc dù power.prop.test dành cho thử nghiệm hai mặt không? - Nếu giá trị p lớn hơn 0,05 trên prop.test thì sao? Tôi có nên cho rằng tôi có một mẫu có ý nghĩa thống kê nhưng không có sự khác biệt có ý nghĩa thống kê giữa hai tỷ lệ? Hơn nữa, ý nghĩa thống kê vốn có trong giá trị p trong prop.test - tức là power.prop.test có cần thiết không?
- Điều gì sẽ xảy ra nếu tôi không thể thực hiện phân tách 50/50 và cần thực hiện, phân chia 95/5? Có một phương pháp để tính kích thước mẫu cho trường hợp này?
- Điều gì sẽ xảy ra nếu tôi không biết dự đoán cơ sở của mình nên theo tỷ lệ nào? Nếu tôi đoán và tỷ lệ thực tế đã tắt, điều đó có làm mất hiệu lực phân tích của tôi không?
Bất kỳ khoảng trống nào khác mà bạn có thể điền vào sẽ được đánh giá cao - lời xin lỗi của tôi về bản chất phức tạp của bài đăng này. Cảm ơn bạn!
>
ở đầu khối trích dẫn) thay vì chỉ tô đậm.