Câu hỏi nào ANOVA trả lời?


9

Tôi muốn học ANOVA. Trước khi tôi bắt đầu tìm hiểu cách thuật toán hoạt động (những tính toán phải được thực hiện) và lý do tại sao nó hoạt động, trước tiên tôi muốn biết chúng ta thực sự giải quyết vấn đề gì với ANOVA, hoặc chúng ta cố gắng trả lời câu trả lời nào. Nói cách khác: đầu vào là gì và đầu ra của thuật toán là gì?

Tôi hiểu những gì chúng ta sử dụng như là một đầu vào. Chúng tôi có một bộ số. Mỗi số đi kèm với các giá trị của một hoặc nhiều biến phân loại (còn được gọi là "các yếu tố"). Ví dụ:

+------------+------------+-------+
|   factor 1 |   factor 2 | value |
+------------+------------+-------+
|     "A"    |     "a"    |  1.0  |
|     "A"    |     "a"    |  2.4  |
|     "A"    |     "b"    |  0.3  |
|     "A"    |     "b"    |  7.4  |
|     "B"    |     "a"    |  1.2  |
|     "B"    |     "a"    |  8.4  |
|     "B"    |     "b"    |  0.4  |
|     "B"    |     "b"    |  7.2  |
+------------+------------+-------+

Có đúng không khi nói rằng ANOVA tính toán giá trị p của giả thuyết null nói rằng không có ảnh hưởng của các yếu tố đến giá trị trung bình của các giá trị? Nói cách khác, chúng tôi cung cấp dữ liệu đã cho ở trên cho thuật toán và kết quả là chúng tôi có được giá trị p của giả thuyết null?

Nếu đó là trường hợp, chúng ta thực sự sử dụng biện pháp nào để tính giá trị p. Ví dụ, chúng ta có thể nói rằng, với giả thuyết null M có thể cao bằng mức được quan sát (hoặc thậm chí cao hơn) chỉ bằng cơ hội trong 1% trường hợp. M là gì?

Chúng tôi cũng không điều tra các yếu tố trong ANOVA riêng biệt? ANOVA có thể nói rằng yếu tố_1 có ảnh hưởng nhưng yếu tố_2 không? ANOVA có thể nói rằng, đối với một giá trị yếu tố nhất định tương ứng với giá trị "A", "B" và "C" không thể phân biệt được về mặt thống kê (ví dụ, có cùng giá trị trung bình) nhưng giá trị "D" có ảnh hưởng không?

Câu trả lời:


6

ANOVA là viết tắt của "Phân tích phương sai". Khá ngạc nhiên, nó phân tích phương sai.

Hãy nói rõ hơn một chút. Quan sát của bạn sẽ thể hiện một số phương sai. Nếu bạn nhóm các quan sát của mình theo yếu tố 1, phương sai trong các nhóm được xác định bởi yếu tố 1 sẽ nhỏ hơn phương sai tổng thể. Yếu tố 1 "giải thích phương sai".

F

FFFpF

(Tại sao thử nghiệm một phía? Bởi vì, như trên, bất kỳ nhóm nào sẽ giải thích một số phương sai, do đó, chỉ có ý nghĩa để kiểm tra xem yếu tố của bạn có giải thích được một lượng phương sai lớn đáng kể hay không .)

Phần "Ví dụ tạo động lực" của mục Wikipedia cung cấp một số minh họa rất hay về các yếu tố giải thích rất ít, một số và rất nhiều phương sai tổng thể.

ANOVA hai chiều và các tương tác, như trong ví dụ của bạn, cũng như ANCOVA, sau đó chỉ là những khái quát về chủ đề này. Trong mỗi trường hợp, chúng tôi điều tra xem việc thêm một số biến giải thích có giải thích một lượng phương sai lớn đáng kể hay không.

Ft


VviM=M(V,v1,v2,...,vk,n1,n2,...,nk). Sau đó, chúng tôi tính xác suất của M là lớn như nó hoặc thậm chí lớn hơn theo giả định rằng giả thuyết null là chính xác.
La Mã

MF

Thành thật mà nói tôi vẫn còn một chút bối rối. Theo như tôi hiểu, ANOVA trả về giá trị p của giả thuyết null. Nhưng mặt khác, từ "Ví dụ tạo động lực" từ Wikipedia, người ta có thể kết luận rằng ANOVA mang đến cho chúng ta yếu tố tốt nhất (hoặc sự kết hợp của các yếu tố), "giải thích" dữ liệu tốt nhất. Vì vậy, trong ví dụ ANOVA nói rằng giống là yếu tố tốt nhất để giải thích trọng lượng của những con chó.
La Mã

1
F
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.