Nếu thử nghiệm t và ANOVA cho hai nhóm là tương đương nhau, tại sao các giả định của chúng không tương đương nhau?


47

Tôi chắc chắn rằng tôi đã hoàn toàn quấn quanh đầu mình, nhưng tôi không thể hiểu được.

Kiểm tra t so sánh hai phân phối bình thường bằng phân phối Z. Đó là lý do tại sao có một giả định về tính quy tắc trong DATA.

ANOVA tương đương với hồi quy tuyến tính với các biến giả và sử dụng tổng bình phương, giống như OLS. Đó là lý do tại sao có một giả định về tính bình thường của CƯ DÂN.

Tôi đã mất vài năm, nhưng tôi nghĩ cuối cùng tôi đã nắm được những sự thật cơ bản đó. Vậy tại sao bài kiểm tra t lại tương đương với ANOVA với hai nhóm? Làm thế nào họ có thể tương đương nếu họ thậm chí không giả định những điều tương tự về dữ liệu?


15
Một điểm: kiểm tra t sử dụng phân phối t chứ không phải phân phối Z
Jeromy Anglim

1
Mặc dù câu hỏi không chính xác, nó rất hữu ích. Ngoài ra, tôi nghĩ rằng việc đề cập đến "bài kiểm tra hai đuôi" ở đâu đó sẽ giúp câu hỏi / câu trả lời hoàn chỉnh hơn.
Gaurav Singhal

Câu trả lời:


29

Thử nghiệm t với hai nhóm giả định rằng mỗi nhóm thường được phân phối với cùng một phương sai (mặc dù các phương tiện có thể khác nhau theo giả thuyết thay thế). Điều đó tương đương với hồi quy với biến giả vì hồi quy cho phép giá trị trung bình của mỗi nhóm khác nhau nhưng không phải là phương sai. Do đó, phần dư (bằng với dữ liệu có nghĩa là nhóm bị trừ) có cùng phân phối --- nghĩa là chúng thường được phân phối với giá trị trung bình bằng không.

Một thử nghiệm t với phương sai không bằng nhau không tương đương với ANOVA một chiều.


3
Tôi có thể tra cứu một trích dẫn, nhưng điều này đủ dễ để kiểm tra theo kinh nghiệm. F từ một ANOVA có hai nhóm hoàn toàn bằng với t ^ 2 và các giá trị p sẽ hoàn toàn giống nhau. Lý do duy nhất nó sẽ không tương đương trong trường hợp phương sai không bằng nhau là nếu bạn áp dụng một sự điều chỉnh. Nếu không, chúng giống nhau.
Brett

3
F-test là sự khái quát hóa của t test. thử nghiệm t là để so sánh 2 điều trị và thử nghiệm F là cho nhiều phương pháp điều trị. Đạo hàm này nằm trong Thiết kế thống kê của Casella, Chương 3 và 4. Tuy nhiên, như Giáo sư Hyndman chỉ ra, với các phương sai không bằng nhau, nó không còn là một bài kiểm tra t nữa. Đó là vấn đề của Fisher Behren. Chúng tôi thường không sử dụng giải pháp của Fisher, thay vào đó sử dụng Thử nghiệm của Welch hoặc phương pháp Bayes.
suncoolsu

Một thử nghiệm t hai mẫu với phương sai không bằng nhau thực sự bằng với ANOVA một chiều với hai nhóm. Có lẽ điều bạn muốn nói là một bài kiểm tra t sử dụng hiệu chỉnh cho các phương sai không bằng nhau (tức là tiếng Wales) không giống với ANOVA một chiều không được sửa (mặc dù tại sao chúng lại như vậy)?
Brett

20

Thử nghiệm t chỉ đơn giản là một trường hợp đặc biệt của thử nghiệm F trong đó chỉ có hai nhóm được so sánh. Kết quả của một trong hai sẽ hoàn toàn giống nhau về giá trị p và cũng có một mối quan hệ đơn giản giữa thống kê F và t. F = t ^ 2. Hai bài kiểm tra tương đương đại số và các giả định của chúng là như nhau.

Trong thực tế, các tương đương này mở rộng cho toàn bộ lớp ANOVAs, kiểm tra t và mô hình hồi quy tuyến tính. Thử nghiệm t là một trường hợp đặc biệt của ANOVA. ANOVA là một trường hợp đặc biệt của hồi quy. Tất cả các thủ tục này được thực hiện theo Mô hình tuyến tính chung và chia sẻ các giả định tương tự.

  1. Độc lập quan sát.
  2. Định mức của phần dư = tính quy tắc trong mỗi nhóm trong trường hợp đặc biệt.
  3. Bằng phương sai của số dư = phương sai bằng nhau giữa các nhóm trong trường hợp đặc biệt.

Bạn có thể coi đó là tính quy tắc trong dữ liệu, nhưng bạn đang kiểm tra tính quy tắc trong mỗi nhóm - điều này thực sự giống như kiểm tra tính quy tắc trong phần dư khi dự đoán duy nhất trong mô hình là chỉ báo của nhóm. Tương tự như vậy với phương sai bằng nhau.

Chỉ là một bên, R không có thói quen riêng cho ANOVA. Các hàm anova trong R chỉ là các hàm bao cho hàm lm () - cùng một thứ được sử dụng để phù hợp với các mô hình hồi quy tuyến tính - được đóng gói một chút khác nhau để cung cấp những gì thường thấy trong một bản tóm tắt ANOVA thay vì tóm tắt hồi quy.


Sẽ được quan tâm để biết làm thế nào để phù hợp với các biện pháp lặp lại mô hình ANOVA bằng cách sử dụng lm.
AndyF

1
Các vấn đề về mã hóa các biến phân loại, sự tương đương của mô hình hồi quy và mô hình ANOVA và mã hóa hồi quy cho các biện pháp lặp lại được mô tả trong bài viết này. dionysus.psych.wisc.edu/Lit/Topics/Statistic/Contrasts/ gợi Đây là trích dẫn ... Wendorf, CA (2004). Primer về mã hóa hồi quy bội: Các dạng phổ biến và trường hợp bổ sung tương phản lặp lại. Hiểu số liệu thống kê 3, 47-57.
Brett

4
@AndyF Không lm(), trừ khi bạn chuyển sang mô hình hỗn hợp với gói nlmehoặc lme4gói, nhưng có một cách thuận tiện để xử lý các phép đo lặp lại thông qua đặc điểm kỹ thuật phù hợp của Errorthuật ngữ này aov(), xem thêm chi tiết về hướng dẫn Baron & Li, §6.9, j.mp/ c5ME4u
chl

@AndyF aov()được xây dựng trên đầu lm()hàm nhưng bao gồm đối số bổ sung, được gọi là các thuật ngữ đặc biệt , như Error.
chl

aov () chỉ đơn giản là một trình bao bọc cho lm (). Nó thực hiện một số mã hóa tương phản đằng sau hậu trường và đóng gói kết quả theo kiểu ANOVA. Tất cả được mô hình hóa bởi lm (). Trong bài viết tôi đã tham khảo ở trên, nó cho bạn biết cách thiết lập mã hóa để thực hiện các tương phản lặp đi lặp lại trong các mô hình hồi quy, bao gồm lm ().
Brett

17

Tôi hoàn toàn đồng ý với câu trả lời của Rob, nhưng hãy để tôi nói theo cách khác (sử dụng wikipedia):

Giả định ANOVA :

  • Độc lập của các trường hợp - đây là một giả định của mô hình đơn giản hóa việc phân tích thống kê.
  • Bình thường - sự phân phối của phần dư là bình thường.
  • Bình đẳng (hay "đồng nhất") của phương sai, được gọi là đồng đẳng

Giả định kiểm tra t :

  • Mỗi trong số hai quần thể được so sánh phải tuân theo phân phối bình thường ...
  • ... hai quần thể được so sánh sẽ có cùng phương sai ...
  • Dữ liệu được sử dụng để thực hiện thử nghiệm phải được lấy mẫu độc lập với hai quần thể được so sánh.

Do đó, tôi sẽ bác bỏ câu hỏi, vì rõ ràng chúng có cùng giả định (mặc dù theo một thứ tự khác :-)).


Xem bình luận cho Rob.
Alexis

@Alexis Tôi không chắc là tôi hiểu downvote của bạn. Chăm sóc công phu.
Henrik

Giả định kiểm tra t thứ hai là không đúng. Công việc ban đầu của sinh viên thông qua giả định này, nhưng "phương sai không bằng nhau" là một giả định đủ phổ biến trong điều trị sau này trong bài kiểm tra.
Alexis

5

Một điểm rõ ràng mà mọi người đều bỏ qua: Với ANOVA, bạn đang kiểm tra null rằng giá trị trung bình là giống hệt nhau bất kể giá trị của các biến giải thích của bạn. Với T-Test, bạn cũng có thể kiểm tra trường hợp một phía, giá trị trung bình cụ thể lớn hơn với một giá trị của biến giải thích của bạn so với giá trị khác.


1
Trừ khi tôi nhầm, đây KHÔNG phải là một sự khác biệt. Nếu bạn thực hiện ANOVA trên hai nhóm, thì bạn có thể thực hiện "kiểm tra một phía" giống như bạn có thể làm trong bài kiểm tra t. Tôi đặt "kiểm tra một phía" trong dấu ngoặc kép vì thực tế không có sự khác biệt nào trong "kiểm tra" giữa "kiểm tra một phía" và "kiểm tra hai phía". Sự khác biệt duy nhất là cách bạn diễn giải ý nghĩa thống kê của các giá trị p. Vì vậy, "thử nghiệm" một mặt so với hai mặt là "thử nghiệm" chính xác giống nhau. Chỉ có cách để giải thích chính xác kết quả là khác nhau.
Tripartio

-3

Tôi sẽ thích sử dụng kiểm tra t để so sánh hai nhóm và sẽ sử dụng ANOVA cho hơn 2 nhóm, vì lý do. Lý do quan trọng là giả định của phương sai bằng nhau.


5
Chào mừng đến với trang web, @syed. Bạn có muốn mở rộng câu trả lời của bạn? Ví dụ, "lý do" nào bạn đang đề cập đến? Lưu ý rằng cả t-test & ANOVA đều giả sử phương sai bằng nhau.
gung - Phục hồi Monica
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.