Có cách nào (cách?) Để giải thích trực quan ANOVA là gì?
Bất kỳ tài liệu tham khảo, liên kết (gói R?) Sẽ được hoan nghênh.
Có cách nào (cách?) Để giải thích trực quan ANOVA là gì?
Bất kỳ tài liệu tham khảo, liên kết (gói R?) Sẽ được hoan nghênh.
Câu trả lời:
Cá nhân, tôi thích giới thiệu hồi quy tuyến tính và ANOVA bằng cách chỉ ra rằng tất cả đều giống nhau và các mô hình tuyến tính có thể phân chia tổng phương sai: Chúng ta có một số loại phương sai trong kết quả có thể được giải thích bằng các yếu tố quan tâm, cộng với không giải thích được một phần (được gọi là 'phần dư'). Tôi thường sử dụng hình minh họa sau (đường màu xám cho tổng biến thiên, đường màu đen cho biến thiên cụ thể của nhóm hoặc cá nhân):
Tôi cũng như các heplots gói R, Michael thân thiện và John Fox từ, nhưng thấy cũng thử nghiệm giả thuyết Visual đa biến tuyến tính Mô hình: Các heplots trọn gói cho R .
Các cách tiêu chuẩn để giải thích những gì ANOVA thực sự làm, đặc biệt là trong khung Mô hình tuyến tính, được giải thích thực sự trong câu trả lời trên mặt phẳng cho các câu hỏi phức tạp , bởi Christensen, nhưng có rất ít minh họa. Phương pháp thống kê của Saville và Wood : Phương pháp hình học có một số ví dụ, nhưng chủ yếu là về hồi quy. Trong Thiết kế và phân tích thử nghiệm của Montgomery , chủ yếu tập trung vào DoE, có những minh họa mà tôi thích, nhưng xem bên dưới
(đó là tôi :-)
Nhưng tôi nghĩ rằng bạn phải tìm sách giáo khoa trên Mô hình tuyến tính nếu bạn muốn xem tổng số hình vuông, lỗi, v.v. chuyển thành không gian vectơ, như được hiển thị trên Wikipedia . Ước tính và suy luận trong Kinh tế lượng , bởi Davidson và MacKinnon, dường như có hình minh họa đẹp (chương 1 thực sự bao gồm hình học OLS) nhưng tôi chỉ duyệt bản dịch tiếng Pháp (có sẵn ở đây ). Hình học của hồi quy tuyến tính cũng có một số minh họa tốt.
Chỉnh sửa :
Ah, và tôi chỉ nhớ bài viết này của Robert Pruzek, Một hình ảnh mới cho ANOVA một chiều .
Chỉnh sửa 2
Và bây giờ, gói granova (được đề cập bởi @ gd047 và được liên kết với bài báo trên) đã được chuyển sang ggplot, xem granovaGG với hình minh họa cho ANOVA một chiều bên dưới.
Cảm ơn bạn cho câu trả lời tuyệt vời của bạn cho đến nay. Trong khi họ rất giác ngộ, tôi cảm thấy rằng việc sử dụng chúng cho khóa học mà tôi hiện đang giảng dạy (tốt, TA'ing) sẽ là quá nhiều đối với các sinh viên của tôi. (Tôi giúp dạy khóa học BioStatistic cho sinh viên từ các bằng cấp cao về khoa học y học)
Do đó, cuối cùng tôi đã tạo ra hai hình ảnh (Cả hai đều dựa trên mô phỏng) mà tôi nghĩ là ví dụ hữu ích để giải thích ANOVA.
Tôi sẽ rất vui khi đọc các bình luận hoặc đề xuất để cải thiện chúng.
Hình ảnh đầu tiên hiển thị mô phỏng 30 điểm dữ liệu, được phân tách thành 3 ô (cho thấy cách MST = Var được phân tách với dữ liệu tạo MSB và MSW:
Hình ảnh thứ hai cho thấy 4 ô, mỗi ô cho một sự kết hợp khác nhau giữa phương sai và kỳ vọng cho các nhóm trong khi
Vì chúng tôi thu thập một số loại biểu đồ đẹp trong bài đăng này, đây là một loại khác mà tôi mới tìm thấy và có thể giúp bạn hiểu cách ANOVA hoạt động và cách thống kê F được tạo. Đồ họa được tạo bằng gói granova trong R.
Hãy xem bài thuyết trình của Hadley Wickham ( pdf , gương ) trên ggplot. Bắt đầu từ trang 23-40 của tài liệu này, ông mô tả một cách tiếp cận thú vị để hình dung ANOVAs.
* Liên kết lấy từ: http://had.co.nz/ggplot2/
Câu hỏi tuyệt vời. Bạn biết đấy, tôi đã đấu tranh bản thân với việc quấn đầu quanh ANOVA trong một thời gian rất dài. Tôi luôn thấy mình quay trở lại với trực giác "giữa so với bên trong" và tôi luôn cố gắng tưởng tượng điều này sẽ như thế nào trong đầu. Tôi rất vui vì câu hỏi này đã được đưa ra, và tôi đã rất ngạc nhiên bởi những cách tiếp cận khác nhau trong câu trả lời ở trên.
Dù sao, trong một thời gian dài (nhiều năm, thậm chí) tôi đã muốn thu thập một số mảnh đất ở một nơi mà tôi có thể thấy những gì đang xảy ra đồng thời từ nhiều hướng khác nhau: 1) cách xa quần thể, 2) cách xa dữ liệu là 3) khoảng cách giữa so với bên trong và 4) làm thế nào để phân phối F trung tâm và không trung tâm so sánh?
Trong một thế giới thực sự tuyệt vời , tôi thậm chí có thể chơi với các thanh trượt để xem kích thước mẫu thay đổi mọi thứ như thế nào .
Vì vậy, tôi đã chơi với manipulate
lệnh trong RStudio và con bò thần thánh, nó hoạt động! Đây là một trong những cốt truyện, một ảnh chụp nhanh, thực sự:
Nếu bạn có RStudio, bạn có thể lấy mã để tạo cốt truyện trên (thanh trượt và tất cả)! trên Github tại đây .
Sau khi chơi với nó một lúc, tôi ngạc nhiên về việc thống kê F phân biệt các nhóm tốt như thế nào, ngay cả đối với các cỡ mẫu vừa phải. Khi tôi nhìn vào quần thể, chúng thực sự không cách xa nhau (trong mắt tôi), tuy nhiên, thanh "bên trong" luôn bị lấn át bởi thanh "giữa". Học một cái gì đó mỗi ngày, tôi đoán.
Để minh họa những gì đang xảy ra với ANOVA một chiều, đôi khi tôi đã sử dụng một applet được cung cấp bởi các tác giả của "Giới thiệu về thực hành thống kê", cho phép các sinh viên chơi trong và giữa các phương sai và quan sát ảnh hưởng của họ đến thống kê F . Đây là liên kết (applet là cái cuối cùng trên trang). Ảnh chụp màn hình mẫu:
Người dùng điều khiển thanh trượt trên cùng, thay đổi mức chênh lệch dọc của ba nhóm dữ liệu. Dấu chấm màu đỏ ở dưới cùng di chuyển dọc theo biểu đồ giá trị p trong khi thống kê F hiển thị bên dưới được cập nhật.
Có vẻ như con tàu đã đi thuyền về câu trả lời, nhưng tôi nghĩ rằng nếu đây là một khóa học giới thiệu mà hầu hết các màn hình được cung cấp ở đây sẽ quá khó để nắm bắt đối với các sinh viên giới thiệu ... hoặc ít nhất là quá khó nắm bắt mà không có màn hình giới thiệu cung cấp một lời giải thích rất đơn giản về phương sai phân vùng. Chỉ cho họ cách tổng SST tăng theo số lượng đối tượng. Sau đó, sau khi hiển thị nó tăng cho một số đối tượng (có thể thêm một đối tượng trong mỗi nhóm vài lần), hãy giải thích rằng SST = SSB + SSW (mặc dù tôi thích gọi nó là SSE ngay từ đầu vì nó tránh nhầm lẫn khi bạn đi đến các đối tượng trong vòng kiểm tra IMO ). Sau đó cho họ thấy một đại diện trực quan của phân vùng phương sai, ví dụ như một hình vuông lớn được mã hóa để bạn có thể thấy SST được tạo từ SSB và SSW như thế nào. Sau đó,
Dưới đây là một số đại diện của các tình huống trong đó một ANOVA sẽ kết thúc với mức độ khác nhau của sự phù hợp giữa và .X