Chỉ cần làm rõ về mối quan hệ với tiêu đề, chúng tôi không sử dụng phân phối t để ước tính giá trị trung bình (theo nghĩa của ước tính điểm ít nhất), nhưng để xây dựng một khoảng cho nó.
Nhưng tại sao sử dụng một ước tính khi bạn có thể có được khoảng tin cậy chính xác?
Đó là một câu hỏi hay (miễn là chúng ta không quá khăng khăng về 'chính xác', vì các giả định cho nó được phân phối chính xác sẽ không thực sự giữ được).
"Bạn phải sử dụng bảng phân phối t khi các vấn đề làm việc khi độ lệch chuẩn dân số (σ) không được biết và kích thước mẫu nhỏ (n <30)"
Tại sao mọi người không sử dụng phân phối T mọi lúc khi độ lệch chuẩn dân số không được biết (ngay cả khi n> 30)?
Tôi coi lời khuyên là - tốt nhất - có khả năng gây hiểu lầm. Trong một số tình huống, phân phối t vẫn nên được sử dụng khi mức độ tự do lớn hơn nhiều.
Trường hợp bình thường là một xấp xỉ hợp lý phụ thuộc vào nhiều thứ khác nhau (và do đó phụ thuộc vào tình huống). Tuy nhiên, vì (với máy tính), không khó để sử dụngt , ngay cả khi df rất lớn, bạn sẽ phải tự hỏi tại sao cần phải lo lắng về việc làm gì đó khác với n = 30.
Nếu kích thước mẫu thực sự lớn, nó sẽ không tạo ra sự khác biệt đáng chú ý đối với khoảng tin cậy, nhưng tôi không nghĩ n = 30 luôn đủ gần với 'thực sự lớn'.
Có một trường hợp trong đó có thể có ý nghĩa khi sử dụng bình thường thay vì t - đó là khi dữ liệu của bạn rõ ràng không thỏa mãn các điều kiện để có phân phối t, nhưng bạn vẫn có thể tranh luận về tính bình thường gần đúng của giá trị trung bình (nếu n khá lớn). Tuy nhiên, trong những trường hợp đó, thường thì t là một xấp xỉ tốt trong thực tế và có thể "an toàn hơn". [Trong tình huống như vậy, tôi có thể có xu hướng điều tra thông qua mô phỏng.]