Cỡ mẫu được yêu cầu để xác định tập hợp quảng cáo nào có tỷ lệ nhấp cao nhất

Tôi là một nhà thiết kế phần mềm bằng thương mại và tôi đang làm việc trong một dự án cho một khách hàng và tôi muốn đảm bảo rằng phân tích của tôi là hợp lý.

Hãy xem xét những điều sau: Chúng tôi có n quảng cáo (n <10) và chúng tôi chỉ đơn giản muốn biết quảng cáo nào hoạt động tốt nhất. Máy chủ quảng cáo của chúng tôi sẽ phục vụ ngẫu nhiên một trong những quảng cáo này. Thành công là nếu người dùng nhấp vào quảng cáo - máy chủ của chúng tôi theo dõi điều đó.

Cho trước: Khoảng tin cậy: 95%

Câu hỏi: Cỡ mẫu ước tính là gì? (Chúng tôi phải phục vụ bao nhiêu quảng cáo), Tại sao? (hãy nhớ tôi là một hình nộm)

Cảm ơn

— Jonathan
nguồn

Bạn có thể làm rõ những gì bạn có nghĩa là "tỷ lệ lỗi 5%"?

— vào

@onestop - Làm rõ tốt - Tôi đã xóa nó khỏi câu hỏi. Tôi chỉ lấy biến đó từ máy tính kích thước mẫu sau: raosoft.com/samplesize.html Nhưng tôi không nghĩ nó có liên quan trong câu hỏi này. Cảm ơn!

— Jonathan

Đối với nhiều thử nghiệm, bạn có thể tính toán kích thước mẫu sao cho thử nghiệm đạt được công suất nhất định với kích thước hiệu ứng giả định (cố định). Nói cách khác, trước tiên bạn phải xác định những điều sau: 1) bạn muốn sử dụng bài kiểm tra nào? 2) sức mạnh nào bạn muốn bài kiểm tra đó có? có điều kiện trên 3) một kích thước hiệu ứng mà bạn cho là thú vị. 1) là một cái gì đó mọi người ở đây có thể có thể giúp bạn với. 2) có thể liên quan đến 95% bạn đã chỉ định. 3) tuy nhiên, có phải là thứ bạn phải cung cấp trước: xác suất phải khác nhau như thế nào để được coi là khác biệt thú vị?

— caracal

Vì vậy, nếu tôi phải cung cấp thêm thông số ở đây, bạn đi: 1. kiểm tra để sử dụng - không có ý tưởng - bạn có đề xuất không? 2. sức mạnh : ngay cả sau khi nhìn vào định nghĩa wikipedia - Tôi không biết làm thế nào để trả lời một cách thông minh. 3. kích thước hiệu ứng : Hãy nói tốt hơn 10%

— Jonathan

Bài kiểm tra mà bạn có thể muốn là bài kiểm tra chính xác của Fisher . Thật không may, với tỷ lệ nhấp rất thấp và kích thước hiệu ứng mong đợi nhỏ, bạn sẽ cần N rất lớn để đạt được khoảng tin cậy mà bạn muốn. Hãy nói rằng tỷ lệ nhấp 'đúng' của quảng cáo tốt nhất của bạn là .11 và tốt nhất thứ hai của bạn .1. Hơn nữa, giả sử bạn muốn xác suất bạn không từ chối giả thuyết không đúng cách (rằng không có sự khác biệt giữa hai quảng cáo), nhỏ hơn 0,20. Nếu điều này là như vậy, bạn sẽ cần một N trên đơn hàng 10.000.

> library(statmod)   
> power.fisher.test(.1,.11,20000,20000,.05)
[1] 0.84

Như một nhà bình luận đã đề xuất, bạn có thể không nên quan tâm đến sự khác biệt mười phần trăm trong hiệu suất quảng cáo. Đối với sự khác biệt về tổng, kích thước cần thiết của các mẫu giảm nhanh chóng.

> power.fisher.test(.1,.2,200,200,.05)
[1] 0.785

— fgregg
nguồn