Bạn có thể đưa ra lý do cho việc sử dụng một bài kiểm tra một đuôi trong phân tích kiểm tra phương sai không?
Tại sao chúng ta sử dụng thử nghiệm một đuôi - thử nghiệm F - trong ANOVA?
Bạn có thể đưa ra lý do cho việc sử dụng một bài kiểm tra một đuôi trong phân tích kiểm tra phương sai không?
Tại sao chúng ta sử dụng thử nghiệm một đuôi - thử nghiệm F - trong ANOVA?
Câu trả lời:
Các xét nghiệm F thường được sử dụng cho hai mục đích:
trong ANOVA, để kiểm tra sự bình đẳng của phương tiện (và các phân tích tương tự khác nhau); và
trong kiểm tra sự bằng nhau của phương sai
Chúng ta hãy xem xét lần lượt từng cái:
1) Các thử nghiệm F trong ANOVA (và tương tự, các loại thử nghiệm chi bình phương thông thường cho dữ liệu đếm) được xây dựng sao cho dữ liệu càng phù hợp với giả thuyết thay thế, thống kê thử nghiệm càng có xu hướng lớn hơn, trong khi sắp xếp mẫu dữ liệu trông phù hợp nhất với null tương ứng với các giá trị nhỏ nhất của thống kê kiểm tra.
Xem xét ba mẫu (có kích thước 10, với phương sai mẫu bằng nhau) và sắp xếp chúng để có phương tiện mẫu bằng nhau, sau đó di chuyển phương tiện của chúng xung quanh theo các mẫu khác nhau. Khi sự thay đổi trong mẫu có nghĩa là tăng từ 0, thống kê F trở nên lớn hơn:
Các đường màu đen () là các giá trị dữ liệu. Các dòng màu đỏ nặng ( | ) là các phương tiện nhóm.
Nếu giả thuyết khống (bình đẳng về phương tiện dân số) là đúng, bạn sẽ mong đợi một số biến thể trong phương tiện mẫu và thường sẽ thấy tỷ lệ F khoảng 1. Kết quả thống kê F nhỏ hơn từ các mẫu gần nhau hơn so với thông thường mong đợi ... vì vậy bạn sẽ không kết luận dân số có nghĩa là khác nhau.
Đó là, đối với ANOVA, bạn sẽ từ chối giả thuyết về sự bình đẳng của phương tiện khi bạn nhận được các giá trị F lớn bất thường và bạn sẽ không từ chối giả thuyết về sự bình đẳng của phương tiện khi bạn nhận được các giá trị nhỏ bất thường (nhưng nó có thể chỉ ra điều gì đó , nhưng không rằng dân số có nghĩa là khác nhau).
Đây là một minh họa có thể giúp bạn thấy rằng chúng tôi chỉ muốn từ chối khi F ở phần trên của nó:
2) F kiểm tra sự bằng nhau của phương sai * (dựa trên tỷ lệ phương sai). Ở đây, tỷ lệ của hai ước lượng phương sai mẫu sẽ lớn nếu phương sai mẫu tử số lớn hơn nhiều so với phương sai trong mẫu số và tỷ lệ sẽ nhỏ nếu phương sai mẫu số mẫu lớn hơn nhiều so với phương sai của tử số.
Đó là, để kiểm tra xem tỷ lệ phương sai dân số có khác 1 hay không, bạn sẽ muốn từ chối null cho cả giá trị lớn và nhỏ của F.
* (Bỏ qua vấn đề về độ nhạy cao đối với giả định phân phối của thử nghiệm này (có những lựa chọn thay thế tốt hơn) và cũng là vấn đề nếu bạn quan tâm đến sự phù hợp của các giả định phương sai ANOVA, chiến lược tốt nhất của bạn có lẽ không phải là kiểm tra chính thức.)
Cần phải hiểu rằng mục tiêu của ANOVA là kiểm tra xem có sự bất bình đẳng về phương tiện hay không ... điều này ngụ ý rằng chúng tôi quan tâm đến các biến thể lớn giữa các mẫu (và do đó có nghĩa là các biến thể được tính từ phương tiện) so với các biến thể trong các mẫu (một lần nữa tính từ trung bình mẫu cá nhân). Khi các biến thể giữa các mẫu là nhỏ (dẫn đến giá trị F nằm ở bên trái) thì không có vấn đề gì vì sự khác biệt này là không đáng kể. Các biến thể giữa các mẫu có vấn đề nếu nó cao hơn đáng kể so với các biến thể bên trong & trong trường hợp đó, giá trị F sẽ lớn hơn 1, và do đó ở đuôi phải.
Câu hỏi duy nhất còn lại là tại sao lại đặt toàn bộ mức ý nghĩa vào đuôi phải và câu trả lời lại tương tự. Việc từ chối chỉ xảy ra khi tỷ lệ F ở bên phải & không bao giờ khi tỷ lệ F ở bên trái. Mức ý nghĩa là thước đo lỗi do giới hạn thống kê. Vì sự từ chối chỉ xảy ra ở bên phải, toàn bộ mức ý nghĩa (rủi ro lỗi của loại trừ sai) được giữ ở bên phải. `
Giá trị dự kiến cho Bình phương trung bình (MS) trong các phương pháp điều trị là phương sai dân số, trong khi giá trị dự kiến cho MS giữa các phương pháp điều trị là phương sai dân số PLUS phương sai điều trị. Do đó, tỷ lệ F = MSb between / MSwithin luôn lớn hơn 1 và không bao giờ nhỏ hơn 1.
Vì độ chính xác của thử nghiệm 1 đuôi tốt hơn thử nghiệm 2 đuôi, chúng tôi thích sử dụng thử nghiệm 1 đuôi.