Làm thế nào để hình dung những gì ANOVA làm?


60

Có cách nào (cách?) Để giải thích trực quan ANOVA là gì?

Bất kỳ tài liệu tham khảo, liên kết (gói R?) Sẽ được hoan nghênh.


Trong blog của mình 'Những nỗ lực của nhà tâm lý học trong lập trình thống kê', Kristoffer Magnusson đã đưa ra một ví dụ tuyệt vời về hình ảnh anova một chiều bằng cách sử dụng D3.js rpsychologist.com/d3-one-way-anova/#comment-1891
Epifunky

Tôi đã tìm thấy hình dung tốt đẹp này về phân tích phương sai là gì. Nó không chính xác như các câu trả lời trước, nhưng bạn có thể tương tác chơi với trực quan hóa. Tìm thấy nó intersting khá: students.brown.edu/seeing-theory/regression/index.html#third
Mike

Câu trả lời:


51

Cá nhân, tôi thích giới thiệu hồi quy tuyến tính và ANOVA bằng cách chỉ ra rằng tất cả đều giống nhau và các mô hình tuyến tính có thể phân chia tổng phương sai: Chúng ta có một số loại phương sai trong kết quả có thể được giải thích bằng các yếu tố quan tâm, cộng với không giải thích được một phần (được gọi là 'phần dư'). Tôi thường sử dụng hình minh họa sau (đường màu xám cho tổng biến thiên, đường màu đen cho biến thiên cụ thể của nhóm hoặc cá nhân):

văn bản thay thế

Tôi cũng như các heplots gói R, Michael thân thiện và John Fox từ, nhưng thấy cũng thử nghiệm giả thuyết Visual đa biến tuyến tính Mô hình: Các heplots trọn gói cho R .

Các cách tiêu chuẩn để giải thích những gì ANOVA thực sự làm, đặc biệt là trong khung Mô hình tuyến tính, được giải thích thực sự trong câu trả lời trên mặt phẳng cho các câu hỏi phức tạp , bởi Christensen, nhưng có rất ít minh họa. Phương pháp thống kê của Saville và Wood : Phương pháp hình học có một số ví dụ, nhưng chủ yếu là về hồi quy. Trong Thiết kế và phân tích thử nghiệm của Montgomery , chủ yếu tập trung vào DoE, có những minh họa mà tôi thích, nhưng xem bên dưới

văn bản thay thế

(đó là tôi :-)

Nhưng tôi nghĩ rằng bạn phải tìm sách giáo khoa trên Mô hình tuyến tính nếu bạn muốn xem tổng số hình vuông, lỗi, v.v. chuyển thành không gian vectơ, như được hiển thị trên Wikipedia . Ước tính và suy luận trong Kinh tế lượng , bởi Davidson và MacKinnon, dường như có hình minh họa đẹp (chương 1 thực sự bao gồm hình học OLS) nhưng tôi chỉ duyệt bản dịch tiếng Pháp (có sẵn ở đây ). Hình học của hồi quy tuyến tính cũng có một số minh họa tốt.

Chỉnh sửa :

Ah, và tôi chỉ nhớ bài viết này của Robert Pruzek, Một hình ảnh mới cho ANOVA một chiều .

Chỉnh sửa 2

Và bây giờ, gói granova (được đề cập bởi @ gd047 và được liên kết với bài báo trên) đã được chuyển sang ggplot, xem granovaGG với hình minh họa cho ANOVA một chiều bên dưới.

nhập mô tả hình ảnh ở đây


Là hình minh họa đầu tiên được tạo ra bằng R?
George Dontas

@ gd047 Có. Nên có mã nguồn xấu xí ở đâu đó nếu bạn muốn. Cái thứ hai được thực hiện trong Metapost.
chl

3
@ gd047 Được rồi, như thường lệ, khi chúng ta tìm mã cũ mà chúng ta không thể tìm thấy nó (mặc dù tôi đã cố gắng hết sức với grep / find), vì vậy tôi đã viết lại một tập lệnh R nhanh (vẫn xấu xí) cho điều đó. Tôi cũng đã đưa ra một ví dụ về mã MP .
chl

Hình học của liên kết hồi quy tuyến tính dường như đã mục nát, thật đáng buồn.
Cá bạc

23

Còn những thứ như thế này thì sao? văn bản thay thế

Theo Crawley (2005). Số liệu thống kê. Giới thiệu sử dụng R: Wiley.


1
(+1) Tôi nhắc tôi plot.design()(nhưng của bạn trong phiên bản nâng cao :-)
chl

Đây là thứ tốt nhất.
Tò mò

13

Cảm ơn bạn cho câu trả lời tuyệt vời của bạn cho đến nay. Trong khi họ rất giác ngộ, tôi cảm thấy rằng việc sử dụng chúng cho khóa học mà tôi hiện đang giảng dạy (tốt, TA'ing) sẽ là quá nhiều đối với các sinh viên của tôi. (Tôi giúp dạy khóa học BioStatistic cho sinh viên từ các bằng cấp cao về khoa học y học)

Do đó, cuối cùng tôi đã tạo ra hai hình ảnh (Cả hai đều dựa trên mô phỏng) mà tôi nghĩ là ví dụ hữu ích để giải thích ANOVA.

Tôi sẽ rất vui khi đọc các bình luận hoặc đề xuất để cải thiện chúng.

Hình ảnh đầu tiên hiển thị mô phỏng 30 điểm dữ liệu, được phân tách thành 3 ô (cho thấy cách MST = Var được phân tách với dữ liệu tạo MSB và MSW:

  • Biểu đồ bên trái hiển thị một biểu đồ phân tán dữ liệu trên mỗi nhóm.
  • Phần giữa cho thấy dữ liệu chúng ta sẽ sử dụng cho MSB trông như thế nào.
  • Hình ảnh bên phải cho thấy dữ liệu chúng ta sẽ sử dụng cho MSW trông như thế nào.

văn bản thay thế

Hình ảnh thứ hai cho thấy 4 ô, mỗi ô cho một sự kết hợp khác nhau giữa phương sai và kỳ vọng cho các nhóm trong khi

  • Hàng lô đầu tiên dành cho phương sai thấp, trong khi hàng thứ hai dành cho phương sai (er) cao.
  • Cột đầu tiên của các ô là cho kỳ vọng bằng nhau giữa các nhóm, trong khi cột thứ hai hiển thị các nhóm có (rất) các kỳ vọng khác nhau.

văn bản thay thế


2
(+1) Tôi luôn nghĩ rằng các thông điệp mang đi khi dạy ANOVA là: (1) chúng ta có tỷ lệ F phản ánh tầm quan trọng tương đối của phương sai chiếm bởi yếu tố quan tâm của chúng ta. tổng phương sai (hoặc MSB / MSW trong đó MSW = MST-MSB), (2) sự khác biệt giữa các nhóm có nghĩa là phương sai và (3) chúng tôi kiểm tra rõ ràng vs. . ( ). Nếu bạn có thể truyền đạt những ý tưởng đó vào một màn hình đồ họa - dường như là trường hợp ở đây--, thì tôi nghĩ bạn đã gần hoàn thành. H0: μ1=μ2==μk H1:  i,j | μiμjH1¬ H0
chl

Xin chào chl, cảm ơn bạn đã phản hồi tích cực (và cho câu trả lời chi tiết trước đó của bạn)! Tôi nghĩ rằng một số cách mát xa tại nhà lớn nhất mà tôi có được từ việc chuẩn bị tài liệu cho lớp này là: 1) Cách mô tả sự biến đổi của dữ liệu gốc để có được các biện pháp phương sai MSB và MSW. 2) Làm thế nào thống kê kiểm tra của MSB / MSW thực sự là một thử nghiệm một mặt (không phải hai mặt) trong đó H0 là MSB <= MSW. Cuối cùng, tôi chỉ nghĩ cần lưu ý rằng đúng là SSW = SST-SSB (nhưng tôi không thấy nó đúng với MSW = MST-MSB).
Tal Galili

1
Đúng, xin lỗi tôi đã viết nhanh chóng. Ý tôi là: Hãy xem xét mô hình hoặc và làm nổi bật đồ họa phân tách sau: , đó là obs. được biểu thị bằng độ lệch so với trung bình lớn + trung bình nhóm + dao động xung quanh trung bình nhóm. Sau đó, chúng ta có hoặc tổng biến thể = giữa biến thể nhóm + biến thể trong nhóm (về cơ bản là hình ảnh đầu tiên của bạn). yij=μ+αi+εijyij=μi+εijyij=yi¯+εij=y¯+(y¯iy¯)+(yijy¯i)(yijy¯)=(y¯iy¯)+(yijy¯i)
chl

12

Vì chúng tôi thu thập một số loại biểu đồ đẹp trong bài đăng này, đây là một loại khác mà tôi mới tìm thấy và có thể giúp bạn hiểu cách ANOVA hoạt động và cách thống kê F được tạo. Đồ họa được tạo bằng gói granova trong R. văn bản thay thế


2
(+1) Tôi đã cung cấp một liên kết đến bài viết của Robert Pruzek, nhưng tôi không biết nó có sẵn trong R.
chl

10

Hãy xem bài thuyết trình của Hadley Wickham ( pdf , gương ) trên ggplot. Bắt đầu từ trang 23-40 của tài liệu này, ông mô tả một cách tiếp cận thú vị để hình dung ANOVAs.

* Liên kết lấy từ: http://had.co.nz/ggplot2/


6

Câu hỏi tuyệt vời. Bạn biết đấy, tôi đã đấu tranh bản thân với việc quấn đầu quanh ANOVA trong một thời gian rất dài. Tôi luôn thấy mình quay trở lại với trực giác "giữa so với bên trong" và tôi luôn cố gắng tưởng tượng điều này sẽ như thế nào trong đầu. Tôi rất vui vì câu hỏi này đã được đưa ra, và tôi đã rất ngạc nhiên bởi những cách tiếp cận khác nhau trong câu trả lời ở trên.

Dù sao, trong một thời gian dài (nhiều năm, thậm chí) tôi đã muốn thu thập một số mảnh đất ở một nơi mà tôi có thể thấy những gì đang xảy ra đồng thời từ nhiều hướng khác nhau: 1) cách xa quần thể, 2) cách xa dữ liệu là 3) khoảng cách giữa so với bên trong và 4) làm thế nào để phân phối F trung tâmkhông trung tâm so sánh?

Trong một thế giới thực sự tuyệt vời , tôi thậm chí có thể chơi với các thanh trượt để xem kích thước mẫu thay đổi mọi thứ như thế nào .

Vì vậy, tôi đã chơi với manipulatelệnh trong RStudio và con bò thần thánh, nó hoạt động! Đây là một trong những cốt truyện, một ảnh chụp nhanh, thực sự:

hình dungANOVA

Nếu bạn có RStudio, bạn có thể lấy mã để tạo cốt truyện trên (thanh trượt và tất cả)! trên Github tại đây .

Sau khi chơi với nó một lúc, tôi ngạc nhiên về việc thống kê F phân biệt các nhóm tốt như thế nào, ngay cả đối với các cỡ mẫu vừa phải. Khi tôi nhìn vào quần thể, chúng thực sự không cách xa nhau (trong mắt tôi), tuy nhiên, thanh "bên trong" luôn bị lấn át bởi thanh "giữa". Học một cái gì đó mỗi ngày, tôi đoán.


3

Để minh họa những gì đang xảy ra với ANOVA một chiều, đôi khi tôi đã sử dụng một applet được cung cấp bởi các tác giả của "Giới thiệu về thực hành thống kê", cho phép các sinh viên chơi trong và giữa các phương sai và quan sát ảnh hưởng của họ đến thống kê F . Đây là liên kết (applet là cái cuối cùng trên trang). Ảnh chụp màn hình mẫu:

nhập mô tả hình ảnh ở đây

Người dùng điều khiển thanh trượt trên cùng, thay đổi mức chênh lệch dọc của ba nhóm dữ liệu. Dấu chấm màu đỏ ở dưới cùng di chuyển dọc theo biểu đồ giá trị p trong khi thống kê F hiển thị bên dưới được cập nhật.


2

Có vẻ như con tàu đã đi thuyền về câu trả lời, nhưng tôi nghĩ rằng nếu đây là một khóa học giới thiệu mà hầu hết các màn hình được cung cấp ở đây sẽ quá khó để nắm bắt đối với các sinh viên giới thiệu ... hoặc ít nhất là quá khó nắm bắt mà không có màn hình giới thiệu cung cấp một lời giải thích rất đơn giản về phương sai phân vùng. Chỉ cho họ cách tổng SST tăng theo số lượng đối tượng. Sau đó, sau khi hiển thị nó tăng cho một số đối tượng (có thể thêm một đối tượng trong mỗi nhóm vài lần), hãy giải thích rằng SST = SSB + SSW (mặc dù tôi thích gọi nó là SSE ngay từ đầu vì nó tránh nhầm lẫn khi bạn đi đến các đối tượng trong vòng kiểm tra IMO ). Sau đó cho họ thấy một đại diện trực quan của phân vùng phương sai, ví dụ như một hình vuông lớn được mã hóa để bạn có thể thấy SST được tạo từ SSB và SSW như thế nào. Sau đó,


2

Dưới đây là một số đại diện của các tình huống trong đó một ANOVA sẽ kết thúc với mức độ khác nhau của sự phù hợp giữa và .XYX

nhập mô tả hình ảnh ở đây

nhập mô tả hình ảnh ở đây

nhập mô tả hình ảnh ở đây

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.