Tại sao phân phối T được sử dụng để kiểm tra giả thuyết hệ số hồi quy tuyến tính?


16

Trong thực tế, sử dụng phép thử T tiêu chuẩn để kiểm tra tầm quan trọng của hệ số hồi quy tuyến tính là cách làm phổ biến. Các cơ chế tính toán có ý nghĩa với tôi.

Tại sao phân phối T có thể được sử dụng để mô hình hóa thống kê kiểm tra tiêu chuẩn được sử dụng trong kiểm tra giả thuyết hồi quy tuyến tính? Thống kê kiểm tra tiêu chuẩn tôi đang đề cập ở đây:

T0=β^β0SE(β^)

Một câu trả lời đầy đủ và đầy đủ cho câu hỏi này sẽ khá dài, tôi chắc chắn. Vì vậy, trong khi bạn chờ đợi ai đó giải quyết vấn đề này, bạn có thể biết được lý do tại sao lại xảy ra trường hợp này bằng cách xem một số ghi chú tôi tìm thấy trực tuyến tại đây: onlinecferences.science.psu.edu/stat501/node/297 . Lưu ý cụ thể rằng . t(np)2=F(1,np)
StatsStudent

1
Tôi không thể tin rằng đây không phải là một bản sao, và tất cả các upvote (cả về câu hỏi và câu trả lời) ... Còn cái này thì sao? Hoặc có lẽ nó không phải là một bản sao, điều đó có nghĩa là có (hoặc có cho đến ngày hôm nay) những chủ đề siêu cơ bản vẫn chưa được đề cập trong gần bảy năm tồn tại của Cross xác thực ... Wow ...
Richard Hardy

@RichardHardy Hmm, nghe có vẻ trùng lặp. Mặc dù dài dòng hơn, câu hỏi cụ thể là: "Làm thế nào tôi có thể chứng minh điều đó cho , " β i-βiβ^iβ^iβisβ^itnk
Firebug

Câu trả lời:


25

Để hiểu lý do tại sao chúng tôi sử dụng phân phối t, bạn cần biết phân phối cơ bản của và tổng bình phương ( ) còn lại là gì khi hai kết hợp này sẽ cung cấp cho bạn phân phối t. RSSβ^RSS

Phần dễ hơn là phân phối là phân phối bình thường - để xem ghi chú này rằng = vì vậy nó là hàm tuyến tính của trong đó . Do đó, nó cũng được phân phối bình thường, - hãy cho tôi biết nếu bạn cần trợ giúp tạo ra sự phân phối của . β (XTX)-1XTYYY~N(Xβ,σ2Tôin) β ~N(β,σ2(XTX)-1) ββ^β^(XTX)1XTYYYN(Xβ,σ2In)β^N(β,σ2(XTX)1)β^

Ngoài ra, , trong đó là số lượng quan sát và là số lượng tham số được sử dụng trong hồi quy của bạn. Bằng chứng về điều này có liên quan nhiều hơn một chút, nhưng cũng đơn giản để rút ra (xem bằng chứng ở đây Tại sao RSS được phân phối vuông lần np? ). n pRSSσ2χnp2np

Cho đến thời điểm này tôi đã xem xét mọi thứ trong ký hiệu ma trận / vectơ, nhưng hãy đơn giản sử dụng và sử dụng phân phối bình thường của nó sẽ cho chúng ta: β i-βiβ^i

β^iβiσ(XTX)ii1N(0,1)

Ngoài ra, từ phân phối chi bình phương của chúng ta có: ( n - p ) s 2RSS

(np)s2σ2χnp2

Đây chỉ đơn giản là sự sắp xếp lại biểu thức chi bình phương đầu tiên và không phụ thuộc vào . Ngoài ra, chúng tôi xác định , đây là một công cụ ước tính không thiên vị cho . Theo định nghĩa của định nghĩa rằng việc phân phối phân phối bình thường cho một bình phương chi độc lập (trên mức độ tự do của nó) mang lại cho bạn một phân phối t (để chứng minh xem: Một bình thường chia cho cung cấp cho bạn bản phân phối t - bằng chứng ) bạn nhận được rằng:s 2 = R S SN(0,1) σ2tn-ps2=RSSnpσ2tnpχ2(s)/s

β^iβis(XTX)ii1tnp

Trong đó .s(XTX)ii1=SE(β^i)

Hãy cho tôi biết nếu nó có ý nghĩa.


Thật là một câu trả lời tuyệt vời! bạn có thể giải thích tại sao ?
β^iβiσ(XTX)ii1N(0,1)
KingDingeling

4

Câu trả lời thực sự rất đơn giản: bạn sử dụng phân phối t vì nó được thiết kế khá nhiều dành riêng cho mục đích này.

Ok, sắc thái ở đây là nó không được thiết kế dành riêng cho hồi quy tuyến tính. Gosset đã đưa ra phân phối mẫu được rút ra từ dân số. Chẳng hạn, bạn vẽ một mẫu và tính giá trị trung bình của nó . Phân phối của một mẫu có nghĩa là gì?x1,x2,,xnx¯=i=1nxi/nx¯

Nếu bạn biết độ lệch chuẩn (dân số) thực sự , thì bạn sẽ nói rằng biến là từ phân phối chuẩn thông thường . Những rắc rối mà bạn thường không biết và chỉ có thể ước tính nó . Vì vậy, Gosset đã tìm ra bản phân phối khi bạn thay thế bằng trong mẫu số và phân phối hiện được gọi theo tên của từ "Sinh viên t".σξ=(x¯μ)n/σN(0,1)σσ^σσ^

Các kỹ thuật của hồi quy tuyến tính dẫn đến tình huống chúng ta có thể ước tính lỗi tiêu chuẩn của ước tính hệ số , nhưng chúng ta không biết đúng , do đó phân phối Student t cũng được áp dụng ở đây.σ^ββ^σ

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.