Tôi có hai quần thể, Một với N = 38,704 (số lượng quan sát) và khác với N = 1,313,662. Các bộ dữ liệu này có ~ 25 biến, tất cả đều liên tục. Tôi lấy trung bình của từng bộ trong mỗi bộ dữ liệu và tính toán thống kê kiểm tra bằng công thức
t = sai số trung bình / lỗi std
Vấn đề là mức độ tự do. Theo công thức của df = N1 + N2-2, chúng ta sẽ có nhiều tự do hơn bảng có thể xử lý. Bất kỳ đề nghị về điều này? Làm thế nào để kiểm tra thống kê t ở đây. Tôi biết rằng thử nghiệm t được sử dụng để xử lý các mẫu nhưng nếu chúng ta áp dụng điều này trên các mẫu lớn.