Có sai không khi sử dụng ANOVA thay vì kiểm tra t để so sánh hai phương tiện?


11

Tôi có một sự phân phối tiền lương và tôi muốn so sánh sự khác biệt về phương tiện cho nam và nữ. Tôi biết có bài kiểm tra T của sinh viên để so sánh hai phương tiện nhưng sau khi đề xuất ANOVA tôi đã nhận được một số lời chỉ trích nói rằng ANOVA là để so sánh nhiều hơn hai phương tiện.

Điều gì (nếu có gì) là sai khi sử dụng nó để so sánh chỉ có 2 nghĩa?


9
Ai nói nó sai?
gung - Phục hồi Monica

1
Tại sao bạn không viết lại câu hỏi loại bỏ bất kỳ giả định nào? Một cái gì đó dọc theo dòng "ANOVA có tương đương với kiểm tra t khi so sánh hai nhóm không?" Chỉ là một ý tưởng ... Tôi sẽ không chịu trách nhiệm về việc chào đón câu hỏi như thế nào :-)
Antoni Parellada

4
Hoặc sửa đổi câu hỏi của bạn để cho ai đó nói rằng nó sai ... vì vậy chúng tôi có thể giải thích rằng họ đã nhầm. Khó khăn ở đây là tiền đề của câu hỏi (rằng nó sai) bị nhầm lẫn.
Glen_b -Reinstate Monica

1
Mặc dù tiền đề bị nhầm lẫn, câu hỏi này dường như không lạc đề hoặc không rõ ràng nên không thể trả lời được (thực sự, nó đã được trả lời). Tôi nghĩ rằng điều này có thể vẫn mở.
gung - Phục hồi Monica

1
Đồng ý, @ gung. Tôi nghĩ rằng câu hỏi phản ánh sự thiếu kiến ​​thức về chủ đề này. Nếu nó được diễn đạt khác nhau (hoặc "tốt hơn"), thì câu hỏi có lẽ sẽ không được hỏi bởi vì sau đó họ đã biết câu trả lời.
D_Williams

Câu trả lời:


20

Nó không sai và sẽ tương đương với thử nghiệm giả định phương sai bằng nhau. Hơn nữa, với hai nhóm, sqrt (f-statistic) bằng với (giá trị aboslute của) thống kê t. Tôi hơi tự tin rằng một bài kiểm tra t với phương sai không bằng nhau là không tương đương. Vì bạn có thể có được ước tính phù hợp khi phương sai không bằng nhau (phương sai thường luôn không bằng một số thập phân), nên có thể sử dụng phép thử t vì nó linh hoạt hơn ANOVA (giả sử bạn chỉ có hai nhóm).

Cập nhật:

Đây là mã để chỉ ra rằng thống kê t ^ 2 cho phép thử t phương sai bằng nhau, nhưng không phải là phép thử t không bằng nhau, giống như thống kê f.

dat_mtcars <- mtcars

# unequal variance model
 t_unequal <- t.test(mpg ~ factor(vs), data = dat_mtcars)
 t_stat_unequal <-  t_unequal$statistic

# assume equal variance
 t_equal <- t.test(mpg ~ factor(vs), var.equal = TRUE, data = dat_mtcars)
 t_stat_equal <- t_equal$statistic

# anova
 a_equal <- aov(mpg ~ factor(vs), data = dat_mtcars)
 f_stat <- anova(a_equal)
 f_stat$`F value`[1]

# compare by dividing (1 = equivalence)
 (t_stat_unequal^2) / f_stat$`F value`[1] 
 (t_stat_equal^2) / f_stat$`F value`[1] # (t-stat with equal var^2) = F

3
+1, lưu ý rằng có thể điều chỉnh thử nghiệm ANOVA / F một chiều cho các phương sai không bằng nhau (xem Giải pháp thay thế cho ANOVA một chiều cho dữ liệu không đồng nhất ).
gung - Phục hồi Monica

@gung OK. Tôi đã không chắc chắn về điều này, vì đôi khi tôi đã không sử dụng ANOVA (đang làm điều Bayes).
D_Williams

Có một lợi thế khác để thực hiệntt

4

Chúng là tương đương. Một ANOVA chỉ có hai nhóm tương đương với thử nghiệm t. Sự khác biệt là khi bạn có một vài nhóm thì lỗi loại I sẽ tăng lên cho các bài kiểm tra t vì bạn không thể kiểm tra giả thuyết chung. ANOVA không gặp phải vấn đề này khi bạn cùng thử nghiệm chúng thông qua thử nghiệm F.


1
Tôi không nghĩ rằng nó mất sức mạnh, tôi nghĩ rằng nó có liên quan nhiều hơn đến các lỗi loại I. Nói chung, bạn càng có nhiều bài kiểm tra, bạn sẽ nhận được sức mạnh cao hơn.
HelloWorld

Tôi tin rằng (như @StudentT nói) đó là vấn đề của lỗi loại I, trong một khóa học tôi đang bắt chúng tôi sử dụng "Sửa lỗi Bonferroni" chính xác cho việc này. vi.wikipedia.org/wiki/Bonferroni_correction
Pablo Fernandez

Vâng, bạn đúng. Không nên là nguồn điện (loại II) mà là lỗi loại I. Tôi tin rằng lý do là chính xác nhưng vì một số lý do tôi đã viết sức mạnh và không phải lỗi loại 1. Tôi sẽ chỉnh sửa để đảm bảo tôi không lừa ai cả.
robinsa
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.