Sự khác biệt giữa kiểm tra t và ANOVA trong hồi quy tuyến tính


12

Tôi tự hỏi sự khác biệt giữa kiểm tra t và ANOVA trong hồi quy tuyến tính là gì?

  1. Là một thử nghiệm t để kiểm tra xem bất kỳ một trong các độ dốc và đánh chặn có nghĩa là không, trong khi ANOVA để kiểm tra xem tất cả các độ dốc có nghĩa là không? Đây có phải là sự khác biệt duy nhất giữa họ?
  2. Trong hồi quy tuyến tính đơn giản, tức là khi chỉ có một biến dự đoán, chỉ có một độ dốc để ước tính. Vì vậy, t-test và ANOVA tương đương, và nếu có, làm thế nào, cho rằng họ đang sử dụng các số liệu thống kê khác nhau (t-test đang sử dụng thống kê t và ANOVA đang sử dụng thống kê F)?

Quảng cáo 1) Trong hồi quy tuyến tính, tôi thường hiểu ANOVA là thước đo mức độ phù hợp của mô hình, nghĩa là quyết định xem mô hình (đường hồi quy) có giải thích một phần đáng kể của tổng biến thiên hay không. Câu hỏi, liệu nó có tương đương với tất cả các độ dốc bằng không, thực sự rất thú vị. Quảng cáo 2) có vẻ như tôi đang nhận được gần như cùng một giá trị p cho kiểm tra t và hồi quy ANOVA trong trường hợp này. Định lý thực sự thú vị!
Tò mò

Câu trả lời:


18

Mô hình tuyến tính tổng quát cho phép chúng ta viết mô hình ANOVA dưới dạng mô hình hồi quy. Giả sử chúng ta có hai nhóm với hai quan sát, ví dụ, bốn quan sát trong một vectơ . Sau đó, ban đầu, mô hình overparametrized là E ( y ) = X beta , nơi X là ma trận các nhân tố ảnh, ví dụ, giả mã các biến chỉ số: ( μ 1 μ 1 μ 2 μ 2 ) = ( 1 1 0 1 1 0 1 0 1 1 0 1yE(y)=XβX

(μ1μ1μ2μ2)=(110110101101)(β0β1β2)

Các thông số này không mang tính chất như X có cấp bậc 2 ( ( X ) ' X là không khả nghịch). Để thay đổi điều đó, chúng tôi giới thiệu các hạn chế β 1 = 0 (tương phản điều trị), mang đến cho chúng ta những mô hình mới E ( y ) = X β : (((X)X)1(X)E(y)X(X)Xβ1=0E(y)=Xβ

(μ1μ1μ2μ2)=(10101111)(β0β2)

Vì vậy, , tức là, beta 0 mất về ý nghĩa của giá trị kỳ vọng từ loại tài liệu tham khảo của chúng tôi (nhóm 1). μ 2 = β 0 + β 2 , tức là, β 2 mất về ý nghĩa của sự khác biệt μ 2 - μ 1μ1=β0β0μ2=β0+β2β2μ2μ1 đến hạng mục tài liệu tham khảo. Vì với hai nhóm, chỉ có một tham số liên quan đến hiệu ứng nhóm, giả thuyết ANOVA null (tất cả các tham số hiệu ứng nhóm là 0) giống như giả thuyết null trọng số hồi quy (tham số độ dốc là 0).

tψ=cjβjψ0c=(0,1)β2=0μ2μ1=0ψ^=cjβ^jβ^=(XX)1Xyψ

t=ψ^ψ0σ^c(XX)1c

σ^2=e2/(nRank(X))e2Rank(X)=2(XX)1X=(.5.500.5.5.5.5)β^0=0.5y1+0.5y2=M1β^2=0.5y10.5y2+0.5y3+0.5y4=M2M1c(XX)1c

t=M2M10σ^=M2M1e2/(n2)

ttnRank(X)n2t(M2M1)2/1e2/(n2)=SSb/dfbSSw/dfw=FFbwFnRank(X)

βj1jψ


3

Trong 1, ANOVA thường sẽ kiểm tra các biến nhân tố và liệu có hay không giữa phương sai nhóm có đáng kể hay không. Bạn sẽ thấy rõ sự khác biệt nếu phần mềm của bạn cho phép các biến chỉ báo theo hồi quy: với mỗi hình nộm, bạn sẽ nhận được giá trị ap cho biết nhóm này có điểm khác biệt đáng kể so với 0 hay không và do đó, khác biệt đáng kể so với nhóm tham chiếu hoặc giá trị tham chiếu áp dụng . Thông thường, bạn sẽ không thấy mức độ chính của chỉ số là quan trọng cho đến khi bạn thực hiện kiểm tra ANOVA.

Một bài kiểm tra F là một bài kiểm tra bình phương. Do đó, trong 2, nó giống nhau.


Cảm ơn! (1) Biến chỉ số có ý nghĩa gì ở đây? (2) Nói chung, kiểm tra t chỉ tương đương với ANOVA khi chỉ có hai nhóm. Nhưng trong hồi quy tuyến tính đơn giản, có thể có nhiều hơn hai nhóm, trong đó số lượng nhóm là số lượng giá trị mà biến dự đoán lấy trong tập dữ liệu.
Tim

(1) Chỉ số hoặc biến phân loại hoặc yếu tố ... tất cả đều giống nhau. (2) Thật vậy, nhưng bạn có thể muốn biết một tập hợp các hình nộm / danh mục từ ANOVA tốt như thế nào.
Lao động

Cảm ơn! (2) Vậy trong hồi quy tuyến tính đơn giản, kiểm tra t tương đương với ANOVA như thế nào, với điều kiện là có nhiều hơn hai nhóm? "Một tập hợp các hình nộm / danh mục từ ANOVA" nghĩa là gì và tại sao tôi muốn biết điều đó?
Tim

Trong hồi quy OLS, R² (phương sai được giải thích) sẽ bằng eta² hoặc MSS / TSS từ ANOVA cho dù bạn có xác định bao nhiêu nhóm. Tiếp theo, bạn có thể muốn biết sự đóng góp của một tập hợp các hình nộm (tức là một biến chỉ báo) để nói liệu chính bộ đó có liên quan hay không và ở mức độ nào, khác với tầm quan trọng của sự khác biệt giữa một danh mục duy nhất với danh mục tham chiếu .
Lao động
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.