Làm thế nào chúng là tất cả các phiên bản của cùng một phương pháp thống kê cơ bản?
Làm thế nào chúng là tất cả các phiên bản của cùng một phương pháp thống kê cơ bản?
Câu trả lời:
Hãy xem xét rằng tất cả chúng có thể được viết dưới dạng phương trình hồi quy (có lẽ với cách hiểu hơi khác so với các dạng truyền thống của chúng).
Hồi quy:
kiểm tra t:
ANOVA:
Hồi quy nguyên mẫu được khái niệm hóa với là một biến liên tục. Tuy nhiên, giả định duy nhất thực sự được thực hiện về là nó là một vectơ của các hằng số đã biết. Nó có thể là một biến liên tục, nhưng nó cũng có thể là một mã giả (ví dụ: vectơ 's & ' cho biết liệu một quan sát có phải là thành viên của một nhóm được chỉ định hay không - ví dụ: nhóm điều trị). Do đó, trong phương trình thứ hai, có thể là một mã giả như vậy và giá trị p sẽ giống như trong phép thử t ở dạng truyền thống hơn. X 0 1 X
Ý nghĩa của betas sẽ khác nhau ở đây, mặc dù. Trong trường hợp này, sẽ là giá trị trung bình của nhóm kiểm soát (trong đó các mục trong biến giả sẽ là ) và sẽ là sự khác biệt giữa giá trị trung bình của nhóm điều trị và giá trị trung bình của nhóm kiểm soát nhóm. 0 β 1
Bây giờ, hãy nhớ rằng việc có / chạy ANOVA chỉ với hai nhóm là hoàn toàn hợp lý (mặc dù thử nghiệm t sẽ phổ biến hơn) và bạn có cả ba kết nối. Nếu bạn thích xem nó hoạt động như thế nào nếu bạn có ANOVA với 3 nhóm; đó sẽ là: Lưu ý rằng khi bạn có các nhóm , bạn có mã giả để đại diện cho chúng. Nhóm tham chiếu (thường là nhóm kiểm soát) được biểu thị bằng cách có 'cho tất cảg g - 1 0 β 0 β 1 β 2
Trong ánh sáng của @ whuber của ý kiến dưới đây, những cũng có thể được biểu diễn qua phương trình ma trận:
Người đại diện theo cách này, & là vectơ có độ dài và là một vectơ có độ dài . hiện là ma trận có hàng và cột . Trong một hồi quy nguyên mẫu, bạn có biến liên tục và chặn. Do đó, ma trận của bạn bao gồm một loạt các vectơ cột cạnh nhau, một cho mỗi
Y ε N β p + 1 X N ( p + 1 ) p X X X 1
Nếu bạn đại diện cho ANOVA với các nhóm theo cách này, hãy nhớ rằng bạn sẽ có các biến giả chỉ ra các nhóm, với nhóm tham chiếu được chỉ ra bởi một quan sát có 'trong mỗi biến giả. Như trên, bạn vẫn sẽ có một đánh chặn. Do đó, . g - 1 0 p = g - 1
Tất cả chúng có thể được viết như các trường hợp cụ thể của mô hình tuyến tính nói chung.
Thử nghiệm t là trường hợp hai mẫu của ANOVA. Nếu bạn bình phương thống kê kiểm tra t, bạn sẽ nhận được tương ứng trong ANOVA.
Một mô hình ANOVA về cơ bản chỉ là một mô hình hồi quy trong đó các mức yếu tố được biểu thị bằng các biến giả (hoặc chỉ báo ) .
Vì vậy, nếu mô hình cho phép thử t là tập con của mô hình ANOVA và ANOVA là tập con của mô hình hồi quy bội, thì chính hồi quy (và những thứ khác ngoài hồi quy) là tập con của mô hình tuyến tính tổng quát , mở rộng hồi quy thành đặc điểm kỹ thuật chung hơn của thuật ngữ lỗi so với trường hợp hồi quy thông thường (đó là 'độc lập' và 'phương sai bằng nhau') và đối với đa biến .
Dưới đây là một ví dụ cho thấy sự tương đương khác thường (tương đương-sai) hai sample- phân tích và thử nghiệm giả thuyết trong mô hình hồi quy, thực hiện trong R (ngoại hình dữ liệu thực tế để được ghép nối, vì vậy đây không phải là thực sự là một phân tích phù hợp) :
> t.test(extra ~ group, var.equal=TRUE, data = sleep)
Two Sample t-test
data: extra by group
t = -1.8608, df = 18, p-value = 0.07919
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-3.363874 0.203874
sample estimates:
mean in group 1 mean in group 2
0.75 2.33
Lưu ý giá trị p của 0,079 ở trên. Đây là một cách anova:
> summary(aov(extra~group,sleep))
Df Sum Sq Mean Sq F value Pr(>F)
group 1 12.48 12.482 3.463 0.0792
Residuals 18 64.89 3.605
Bây giờ cho hồi quy:
> summary(lm(extra ~ group, data = sleep))
(một số đầu ra bị loại bỏ)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.7500 0.6004 1.249 0.2276
group2 1.5800 0.8491 1.861 0.0792 .
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 1.899 on 18 degrees of freedom
Multiple R-squared: 0.1613, Adjusted R-squared: 0.1147
F-statistic: 3.463 on 1 and 18 DF, p-value: 0.07919
So sánh giá trị p trong hàng 'nhóm2' và giá trị p cho thử nghiệm F ở hàng cuối cùng. Đối với thử nghiệm hai đuôi, đây là giống nhau và cả hai đều khớp với kết quả thử nghiệm t.
Hơn nữa, hệ số cho 'nhóm2' thể hiện sự khác biệt về phương tiện cho hai nhóm.
Anova tương tự như một thử nghiệm t cho sự bình đẳng của các phương tiện theo giả định về phương sai không xác định nhưng bằng nhau giữa các phương pháp điều trị. Điều này là do trong ANOVA MSE giống hệt với phương sai gộp được sử dụng trong kiểm tra t. Có các phiên bản khác của kiểm tra t như một cho các phương sai không bằng nhau và kiểm tra t-khôn ngoan theo cặp. Từ quan điểm này, kiểm tra t có thể linh hoạt hơn.