Các G-Test là một cách để có được ước tính nhanh chóng của một phân phối bình chi, và được khuyến khích bởi tác giả của hướng dẫn thử nghiệm A / B nổi tiếng này .
Công cụ này giả định phân phối bình thường và sử dụng sự khác biệt của phương tiện để tính toán độ tin cậy.
Sự khác biệt giữa kiểm tra G và kiểm tra T là gì? Những lợi ích hoặc nhược điểm của việc sử dụng từng phương pháp để đo lường hiệu quả của các xét nghiệm A / B của chúng tôi là gì?
Tôi đang cố gắng tìm ra cái nào tôi nên sử dụng để đo lường kết quả của khung kiểm tra A / B của mình. Khung của chúng tôi có hai trường hợp sử dụng chung: chia đều nhóm khách truy cập, hiển thị cho mỗi người một tính năng khác nhau và đo lường chuyển đổi của họ trên một số trang khác (giả sử, trang đăng ký); và chia nhóm khách truy cập thành nhóm kiểm soát (90%) và nhóm thử nghiệm (10%) để thử nghiệm và đo lường chuyển đổi trên một số trang khác.
Trang web của chúng tôi nhận được từ 1000 đến 200.000 lượt truy cập mỗi ngày (Tôi đang mơ hồ về mục đích che giấu con số thật, điều này không thay đổi nhiều). Các lượt truy cập này được phân chia với phân phối theo cấp số nhân trên khoảng 300 trang.
Cảm ơn, Kevin