Tại sao thống kê T cần dữ liệu để tuân theo phân phối bình thường


11

Tôi đã nhìn vào cuốn sổ này và tôi rất bối rối trước câu nói này:

Khi chúng ta nói về tính quy tắc, điều chúng tôi muốn nói là dữ liệu sẽ trông giống như một phân phối bình thường. Điều này rất quan trọng vì một số thử nghiệm thống kê dựa trên điều này (ví dụ: thống kê t).

Tôi không hiểu tại sao thống kê T cần dữ liệu để tuân theo phân phối bình thường.

Thật vậy, Wikipedia nói điều tương tự:

Phân phối t của sinh viên (hoặc đơn giản là phân phối t) là bất kỳ thành viên nào trong một gia đình phân phối xác suất liên tục phát sinh khi ước tính giá trị trung bình của dân số phân phối bình thường

Tuy nhiên, tôi không hiểu tại sao giả định này là cần thiết.

Không có gì từ công thức của nó chỉ ra cho tôi rằng dữ liệu phải tuân theo phân phối bình thường:

nhập mô tả hình ảnh ở đây

Tôi đã xem xét một chút về định nghĩa của nó nhưng tôi không hiểu tại sao điều kiện này lại cần thiết.

Câu trả lời:


17

Thông tin bạn yêu cầu nằm trong phần "Đặc tính" của trang Wiki . Một phân phối với mức độ tự do ν có thể được định nghĩa là phân phối của biến ngẫu nhiên T sao cho T = ZtνT trong đó Z là biến ngẫu nhiên phân phối chuẩn thông thường và V làbiến ngẫu nhiên χ 2 với bậc tự do ν . Ngoài ra, Z V phải độc lập. Vì vậy, với bất kỳ Z V nào theo định nghĩa trên, sau đó bạn có thể đến một biến ngẫu nhiên cóphân phối t .

T=ZV/ν,
ZVχ2νZVZVt

X1,X2,,XnFFμσ2X¯S2

X¯μS/n=X¯μσ/n(n1)S2(n1)σ2.

FX¯N(μ,σ2/n)X¯μσ/nN(0,1)(n1)S2σ2χn12X¯S2tn1

Fχ2t


3
Tôi luôn thấy khá thú vị khi có bao nhiêu công nghệ toán học đi vào những kết quả nền tảng này trong thống kê toán học.
Matthew Drury

3
X¯Sχ2

2

Tôi nghĩ rằng có thể có một số nhầm lẫn giữa thống kê và công thức của nó, so với phân phối và công thức của nó. Bạn có thể áp dụng công thức thống kê t cho bất kỳ tập dữ liệu nào và nhận "thống kê t", nhưng thống kê này sẽ không được phân phối theo phân phối của sinh viên trừ khi dữ liệu đến từ phân phối bình thường (hoặc ít nhất, sẽ không được được đảm bảo, tôi đoán là các phân phối không bình thường sẽ không tạo ra phân phối cho sinh viên khi áp dụng công thức thống kê t, nhưng tôi không chắc về điều đó). Lý do đơn giản là việc phân phối thống kê t được tính từ phân phối dữ liệu đã tạo ra dữ liệu đó, vì vậy nếu bạn có phân phối cơ bản khác, thì bạn không được đảm bảo có cùng phân phối cho thống kê dẫn xuất.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.