Vấn đề thực tế
Một trong những khách hàng của tôi đang chuẩn bị gửi một người gửi thư trực tiếp đến danh sách người dùng đã đăng ký của họ và thách thức thống kê này đã xuất hiện.
Đội ngũ tiếp thị của họ có 3 tài liệu quảng cáo khác nhau và muốn biết tài liệu nào nhận được tỷ lệ phản hồi cao nhất. Họ cũng muốn biết nếu gửi bưu phẩm có địa chỉ viết tay, trên một phong bì dày, sẽ cải thiện kết quả so với một phong bì thông thường.
Hãy giả sử như sau:
- Đối với mỗi tài liệu ( ), một người nhận tài liệu đó thực sự mở nó và đọc nó sẽ trả lời với xác suất , trong đó là tỷ lệ phản hồi thực sự cho tài liệu đó i = 1 , 2 , 3 r i r i
- Các phong bì dày, chất lượng cao có tỷ lệ mở thực sự là trong khi các phong bì thông thường có tỷ lệ mở là o n o r m a l
- Từ các thư trước, chúng tôi hy vọng tỷ lệ phản hồi được quan sát thực tế sẽ nằm trong khoảng từ 1% đến 5%.
Mục tiêu của chúng tôi
Chúng tôi muốn tìm tài liệu tốt nhất trong khi gửi số lượng người gửi thư ít nhất. Chúng tôi cũng muốn ước tính hai tỷ lệ mở.
Khi thu thập tỷ lệ phản hồi theo kinh nghiệm từ các thư được gửi thực tế, nếu chênh lệch thực giữa tỷ lệ phản hồi lớn hơn một nửa phần trăm, chúng ta sẽ có thể phát hiện sự khác biệt đó có ý nghĩa thống kê với p < .05
Suy nghĩ của tôi cho đến nay
Chúng tôi chỉ định ngẫu nhiên người dùng cho mỗi trong số 3 tài liệu quảng cáo, sao cho người dùng nhận được mỗi tập tài liệu. Chúng tôi muốn biết chúng tôi cần gì để đạt được độ nhạy mong muốn trong việc phát hiện sự khác biệt về tỷ lệ phản hồi. Giả sử trường hợp xấu nhất, chúng ta cần có khả năng phát hiện sự khác biệt giữa tỷ lệ thực 1% và 1,5%. SD cho sự khác biệt này là . Đặt hai lần số lượng đó (2 độ lệch chuẩn cho chúng tôi độ tin cậy 95%) bằng 0,005 (nửa phần trăm mong muốn của chúng tôi) dẫn đến giải pháp .N √ N=3948
Câu hỏi
- Đây có phải là thiết kế tối ưu hay chúng ta có thể làm tốt hơn?
- Tính toán của tôi về đúng không?
Cuối cùng, cách tốt nhất để ước tính và , hay đơn giản là sự khác biệt giữa hai? o t h i c k
Ý tưởng của tôi là chỉ định ngẫu nhiên một nửa của mỗi nhóm tài liệu cho từng loại phong bì. Trong mỗi nhóm tài liệu, tỷ lệ phản hồi được quan sát sẽ là sản phẩm của tỷ lệ mở và . Điều này sẽ làm phức tạp tính toán của tôi về ở trên, vì thực sự tôi nên sử dụng sản phẩm này trong tính toán của mình. N
Câu trả lời của tôi sau đó sẽ phụ thuộc vào ước tính tỷ lệ mở trung bình - - mà tôi phải đoán. Ngoài ra, tôi không chắc chắn làm thế nào để xác định phân phối chênh lệch giữa và , vì hiện tại chúng tôi có ba ước tính khác nhau về sự khác biệt đó, mỗi ước tính phụ thuộc vào một khác nhau , mỗi loại chúng tôi có chỉ ước tính theo kinh nghiệm, ước tính theo kinh nghiệm mà bản thân chúng phụ thuộc vào dự đoán của chúng tôi ở tỷ lệ mở trung bình. onormalothickri
Cảm ơn rất nhiều cho bất kỳ sự giúp đỡ với điều này.