Có lẽ bạn đang nghĩ đến thử nghiệm hai mẫu t vì đó thường là nơi đầu tiên phân phối t xuất hiện. Nhưng thực sự tất cả một thử nghiệm t có nghĩa là phân phối tham chiếu cho thống kê kiểm tra là phân phối t . Nếu Z∼N(0,1) và S2∼χ2d với Z và S2 độc lập, sau đó
ZS2/d−−−−√∼td
theo định nghĩa. Tôi viết thư này để nhấn mạnh rằngphân phối
tchỉ là một tên được đặt cho phân phối tỷ lệ này vì nó xuất hiện rất nhiều và bất cứ thứ gì thuộc dạng này sẽ cóphân phối
t. Đối với thử nghiệm t hai mẫu, tỷ lệ này xuất hiện vì theo null sự khác biệt trong phương tiện là một Gaussian zero-mean và dự toán không đúng cho Gaussian độc lập là một độc lập
χ2(tính độc lập có thể được hiển thị thông qua
định lý Basu của trong đó sử dụng thực tế là ước tính phương sai chuẩn trong mẫu Gaussian là phụ trợ cho trung bình dân số, trong khi giá trị trung bình mẫu là đầy đủ và đủ cho cùng một đại lượng đó).
Với hồi quy tuyến tính, về cơ bản chúng ta có được điều tương tự. Ở dạng β^∼N(β,σ2(XTX)−1) . Đặt S2j=(XTX)−1jj và giả sử các yếu tố dự đoán X là không ngẫu nhiên. Nếu chúng ta biết σ2 chúng tôi có
β j - 0
β^j−0σSj∼N(0,1)
dưới null
H0:βj=0vì vậy chúng tôi thực sự có một bài kiểm tra Z. Nhưng một khi chúng tôi ước tính
σ2chúng tôi kết thúc với một
χ2biến ngẫu nhiên đó, theo các giả định bình thường của chúng tôi, hóa ra là không phụ thuộc vào số liệu thống kê của chúng tôi
β jvà sau đó chúng ta có được một
tphân phối.
β^jt
Dưới đây là các chi tiết về điều đó: giả y∼N(Xβ,σ2I) . Cho H=X(XTX)−1XT là ma trận mũ chúng tôi có
∥e∥2=∥(I−H)y∥2=yT(I−H)y.
H là idempotent vì vậy chúng tôi có kết quả thực sự tốt đẹp rằng
yT(I−H)y/σ2∼χ2n−p(δ)
với phi trung tâm thông số
δ=βTXT(I−H)Xβ=βT(XTX−XTX)β=0 , vì vậy trên thực tế đây là một trung tâm
χ2 với
n−p bậc tự do (đây là trường hợp đặc biệt
của định lý của Burran ). Tôi đang sử dụng
p để biểu thị số lượng cột của
X , vì vậy nếu một cột của
X đưa ra đánh chặn thì chúng ta sẽ có
p−1 dự đoán không chặn. Một số tác giả sử dụng
p là số lượng dự đoán không chặn, vì vậy đôi khi bạn có thể thấy một cái gì đó giống như
n−p−1 ở mức độ tự do ở đó, nhưng tất cả đều giống nhau.
Kết quả của việc này là , vì vậy σ 2 : = 1E(eTe/σ2)=n−phoạt động tuyệt vời như một công cụ ước tínhσ2.σ^2:=1n−peTeσ2
Điều này có nghĩa rằng
β j
là tỷ lệ của một Gaussian tiêu chuẩn so với bình phương chia cho mức độ tự do của nó. Để hoàn thành điều này, chúng ta cần thể hiện sự độc lập và chúng ta có thể sử dụng kết quả sau:
β^jσ^Sj=β^jSjeTe/(n−p)−−−−−−−−−−√=β^jσSjeTeσ2(n−p)−−−−−−√
Kết quả: cho và ma trận A và B trong R l × k và R m × k tương ứng, Một Z và B Z là độc lập khi và chỉ khi A Σ B T = 0 (đây là tập thể dục 58 (b) trong chương 1 của Thống kê toán học của Jun Shao ).Z∼Nk(μ,Σ)ABRl×kRm×kAZBZAΣBT=0
Chúng tôi có β = ( X T X ) - 1 X T y và e = ( I - H ) y nơi y ~ N ( X β , σ 2 tôi ) . Điều này có nghĩa
( X T X ) - 1 X T ⋅ σ 2 Tôi ⋅ ( I - H ) T = σ 2β^=(XTX)−1XTye=(I−H)yy∼N(Xβ,σ2I)
nên beta ⊥e, và do đó beta ⊥ e T e.
(XTX)−1XT⋅σ2I⋅(I−H)T=σ2((XTX)−1XT−(XTX)−1XTX(XTX)−1XT)=0
β^⊥eβ^⊥eTe
Kết quả cuối cùng là bây giờ chúng ta biết
β j
như mong muốn (dưới tất cả các giả định ở trên).
β^jσ^Sj∼tn−p
Đây là bằng chứng của kết quả đó. Đặt là(l+m)×kma trận hình thành bằng cách chồngAtrên đầu trang củaB. Khi đó
CZ= ( AZC=(AB)(l+m)×kAB
trong đó
CΣCT=(A
CZ=(AZBZ)∼N((AμBμ),CΣCT)
CZlà một Gaussian đa biến và một kết quả nổi tiếng là hai thành phần của Gaussian đa biến là độc lập khi và chỉ khi chúng không tương thích, do đó điều kiện
AΣBT=0hóa ra tương đương chính xác với các thành phần
AZvà
BZCΣCT=(AB)Σ(ATBT)=(AΣATBΣATAΣBTBΣBT).
CZAΣBT=0AZBZtrong
không tương quan.
CZ
□