Tôi có một bộ kết quả từ thử nghiệm A / B (một nhóm kiểm soát, một nhóm tính năng) không phù hợp với Phân phối chuẩn. Trong thực tế, phân phối gần giống với phân phối Landau hơn.
Tôi tin rằng thử nghiệm t độc lập yêu cầu các mẫu ít nhất được phân phối bình thường, điều này không khuyến khích tôi sử dụng thử nghiệm t như một phương pháp thử nghiệm quan trọng hợp lệ.
Nhưng câu hỏi của tôi là: Tại thời điểm nào người ta có thể nói rằng kiểm tra t không phải là một phương pháp tốt để kiểm tra ý nghĩa?
Hoặc đặt một cách khác, làm thế nào người ta có thể đủ điều kiện độ tin cậy của các giá trị p của kiểm tra t, chỉ được cung cấp cho tập dữ liệu?