Tôi cố gắng để hiểu ý tưởng đằng sau phân phối t. Đây là các bước mà tôi đã hiểu cho đến nay:
- Chúng tôi sử dụng một mẫu gồm các yếu tố N để ước tính trung bình dân số. Để biết thêm chi tiết, chúng tôi sử dụng trung bình mẫu như là một ước tính của trung bình dân số.
- Chúng tôi muốn biết ước tính của chúng tôi gần với giá trị thực như thế nào. Hoặc, cụ thể hơn, chúng tôi muốn biết khoảng cách xung quanh mẫu có nghĩa là bao nhiêu để chúng tôi có thể nói rằng trung bình dân số nằm trong khoảng này với một xác suất nhất định.
- Để trả lời câu hỏi này, chúng tôi giả định rằng các giá trị trong dân số được phân phối theo phân phối bình thường với độ lệch chuẩn và trung bình đã biết.
- Có các tham số phân bố các giá trị trong dân số, chúng ta có thể tính toán phân bố của mẫu có nghĩa là một hàm của phân bố dân số và kích thước của mẫu.
- Chúng ta có thể chỉ ra rằng phân phối của giá trị trung bình mẫu cũng là một phân phối bình thường có cùng giá trị trung bình với phân bố dân số và độ lệch chuẩn được đưa ra bởi công thức sau , trong đó là kích thước của mẫu .
- Có phân phối trung bình mẫu, chúng ta có thể dễ dàng tính xác suất trung bình mẫu được tách ra khỏi giá trị trung bình thực của X. Hay nói cách khác, chúng ta có thể tính xác suất trung bình dân số nằm trong một khoảng nhất định xung quanh giá trị trung bình của mẫu .
- Nó gần như là những gì chúng ta cần. Vấn đề duy nhất là trong các cài đặt thực tế, chúng ta thường không biết độ lệch chuẩn của phân bố dân số (và đây là tham số xác định mức trung bình mẫu của chúng ta được phân phối xung quanh trung bình dân số).
- Những gì chúng ta có thể làm là thay thế độ lệch chuẩn dân số bằng độ lệch chuẩn mẫu. Nói cách khác, chúng tôi thay thế tham số chính xác và chưa biết bằng ước tính gần đúng của chúng tôi về nó.
Vì vậy, đây là nơi tôi đang ở cho đến nay. Bằng cách thay thế STD dân số bằng STD mẫu, chúng tôi làm cho ước tính phân phối mẫu có ý nghĩa tồi tệ hơn. Và để "bù" giá trị "sai" này của các tham số của phân phối, chúng tôi thay đổi hình dạng phân phối (chúng tôi nói rằng đó không phải là phân phối bình thường nữa, đó là phân phối t). Nhưng chính xác những gì được phân phối theo phân phối t? Khi chúng ta biết STD dân số, chúng ta biết ý nghĩa của mẫu được phân phối xung quanh dân số có nghĩa là gì. Bây giờ chúng tôi không biết STD dân số, nhưng nó không thay đổi sự phân bố của mẫu trung bình xung quanh ý nghĩa dân số!
X_n
), chúng ta nói về "giá trị trung bình chuẩn". Chúng ta có thể nói rằng phân phối của giá trị trung bình tiêu chuẩn là bình thường với giá trị trung bình bằng 0 và STD bằng 1. Không chúng tôi xác định một biến khác bằng cách thay thế quần thể STD bằng STD mẫu và nói rằng biến mới này được phân phối theo phân phối t. ĐỒNG Ý. Điều cuối cùng mà tôi không hiểu là tại sao chúng ta không thay thế trung bình dân số bằng trung bình mẫu. Nếu chúng ta không biết sigma, có lẽ chúng ta cũng không biết mu.