Tại sao chúng ta sử dụng thử nghiệm F thử nghiệm một đầu trong phân tích phương sai (ANOVA)?


13

Bạn có thể đưa ra lý do cho việc sử dụng một bài kiểm tra một đuôi trong phân tích kiểm tra phương sai không?

Tại sao chúng ta sử dụng thử nghiệm một đuôi - thử nghiệm F - trong ANOVA?


2
Một số câu hỏi để hướng dẫn suy nghĩ của bạn ... Thống kê t rất tiêu cực có nghĩa là gì? Là một thống kê F tiêu cực có thể? Thống kê F rất thấp có nghĩa là gì? Thống kê F cao có nghĩa là gì?
russellpierce

Tại sao bạn có ấn tượng rằng bài kiểm tra một đầu phải là Bài kiểm tra F? Để trả lời câu hỏi của bạn: F-Test cho phép kiểm tra một giả thuyết có nhiều hơn một tổ hợp tham số tuyến tính.
IMA

1
Bạn có muốn biết lý do tại sao một người sẽ sử dụng thử nghiệm một đuôi thay vì thử nghiệm hai đuôi không?
Jens Kouros

@tree những gì cấu thành một nguồn đáng tin cậy hoặc chính thức cho mục đích của bạn?
Glen_b -Reinstate Monica

1
@tree lưu ý rằng câu hỏi của Cynderella ở đây không phải là về kiểm tra phương sai, mà cụ thể là kiểm tra F của ANOVA - một bài kiểm tra về sự bình đẳng của phương tiện . Nếu bạn quan tâm đến các bài kiểm tra về sự bằng nhau của phương sai, điều đó đã được thảo luận trong nhiều câu hỏi khác trên trang web này. (Đối với kiểm tra đúng, vâng, bạn làm chăm sóc về cả đuôi, như được giải thích rõ ràng trong câu cuối cùng của phần này , ngay trên ' Thuộc tính ')
Glen_b -Reinstate Monica

Câu trả lời:


17

Các xét nghiệm F thường được sử dụng cho hai mục đích:

  1. trong ANOVA, để kiểm tra sự bình đẳng của phương tiện (và các phân tích tương tự khác nhau); và

  2. trong kiểm tra sự bằng nhau của phương sai

Chúng ta hãy xem xét lần lượt từng cái:

1) Các thử nghiệm F trong ANOVA (và tương tự, các loại thử nghiệm chi bình phương thông thường cho dữ liệu đếm) được xây dựng sao cho dữ liệu càng phù hợp với giả thuyết thay thế, thống kê thử nghiệm càng có xu hướng lớn hơn, trong khi sắp xếp mẫu dữ liệu trông phù hợp nhất với null tương ứng với các giá trị nhỏ nhất của thống kê kiểm tra.

Xem xét ba mẫu (có kích thước 10, với phương sai mẫu bằng nhau) và sắp xếp chúng để có phương tiện mẫu bằng nhau, sau đó di chuyển phương tiện của chúng xung quanh theo các mẫu khác nhau. Khi sự thay đổi trong mẫu có nghĩa là tăng từ 0, thống kê F trở nên lớn hơn:

Sắp xếp 3 mẫu và thống kê F tương ứng

Các đường màu đen () là các giá trị dữ liệu. Các dòng màu đỏ nặng ( | ) là các phương tiện nhóm.||

Nếu giả thuyết khống (bình đẳng về phương tiện dân số) là đúng, bạn sẽ mong đợi một số biến thể trong phương tiện mẫu và thường sẽ thấy tỷ lệ F khoảng 1. Kết quả thống kê F nhỏ hơn từ các mẫu gần nhau hơn so với thông thường mong đợi ... vì vậy bạn sẽ không kết luận dân số có nghĩa là khác nhau.

Đó là, đối với ANOVA, bạn sẽ từ chối giả thuyết về sự bình đẳng của phương tiện khi bạn nhận được các giá trị F lớn bất thường và bạn sẽ không từ chối giả thuyết về sự bình đẳng của phương tiện khi bạn nhận được các giá trị nhỏ bất thường (nhưng nó có thể chỉ ra điều gì đó , nhưng không rằng dân số có nghĩa là khác nhau).

Đây là một minh họa có thể giúp bạn thấy rằng chúng tôi chỉ muốn từ chối khi F ở phần trên của nó:

Mô tả F cho ANOVA, từ chối khi thống kê F ở đuôi trên

2) F kiểm tra sự bằng nhau của phương sai * (dựa trên tỷ lệ phương sai). Ở đây, tỷ lệ của hai ước lượng phương sai mẫu sẽ lớn nếu phương sai mẫu tử số lớn hơn nhiều so với phương sai trong mẫu số và tỷ lệ sẽ nhỏ nếu phương sai mẫu số mẫu lớn hơn nhiều so với phương sai của tử số.

Đó là, để kiểm tra xem tỷ lệ phương sai dân số có khác 1 hay không, bạn sẽ muốn từ chối null cho cả giá trị lớn và nhỏ của F.

* (Bỏ qua vấn đề về độ nhạy cao đối với giả định phân phối của thử nghiệm này (có những lựa chọn thay thế tốt hơn) và cũng là vấn đề nếu bạn quan tâm đến sự phù hợp của các giả định phương sai ANOVA, chiến lược tốt nhất của bạn có lẽ không phải là kiểm tra chính thức.)


2
Thử nghiệm của @TaylerJones Levene có phần mạnh mẽ hơn. Browne-Forsythe mạnh mẽ hơn (nhưng mất một chút sức mạnh gần mức bình thường). Fligner-Killeen một lần nữa. Trong vài thập kỷ, tôi đã sử dụng Levene hoặc Browne-Forsythe không quá hai lần mỗi lần. (Nếu nó xuất hiện trở lại, có thể một cái gì đó như Browne-Forsythe sẽ phù hợp với tôi nhưng tôi thường không có tình huống kiểm tra sự khác biệt của một số nhóm về sự bình đẳng.)
Glen_b -Reinstate Monica

2
F= =MSTREMộtTMENTMSERRÔiR1F

2
@tree có vẻ như bạn không hiểu gì về kiểm tra giả thuyết nói chung, nhưng thật khó để chắc chắn chính xác ở đâu. Bạn nói rằng bạn hiểu rằng nếu bạn nhận được một F lớn, bạn muốn từ chối và nếu bạn nhận được một F nhỏ, bạn không muốn từ chối. Các giá trị lớn của F là các giá trị ở đuôi trên trong khi các giá trị nhỏ của F là các giá trị ở đuôi dưới. Bạn chỉ muốn từ chối khi các giá trị lớn ... tức là ở đuôi trên, nhưng không phải ở đuôi dưới. Làm thế nào bạn có thể không nhìn thấy một đuôi? Tôi sẽ bao gồm một âm mưu khác có thể giúp đỡ.
Glen_b -Reinstate Monica

1
@jeramy Nhận xét của tôi đề cập đến các thử nghiệm dựa trên tỷ lệ phương sai (cụ thể, tôi đã nói " Ở đây, tỷ lệ của hai ước tính phương sai mẫu sẽ ..."). Các thử nghiệm mà bạn đề cập để tìm sự khác biệt về vị trí trong số dư tuyệt đối từ một số biện pháp vị trí để phát hiện sự khác biệt về mức độ lây lan; họ tự nhiên làm việc theo cách kiểm tra sự khác biệt về vị trí làm việc. Vì tôi đã cố gắng chỉ ra một trường hợp mà bạn sẽ nhìn vào phần đuôi dưới của F, Brown-Forsythe (& một số thử nghiệm khác tìm sự khác biệt về vị trí trong một số biện pháp sai lệch để suy ra sự khác biệt lan truyền) sẽ không giúp ích gì
Glen_b -Reinstate Monica

1
@jeramy Tôi đã thêm một vài từ để làm cho nó rõ ràng hơn. Bạn có thể lưu ý rằng mặc dù Brown-Forsythe, Levene và vv sử dụng bảng F, việc phân phối số liệu thống kê kiểm tra không thực sự được phân phối F, ngay cả theo các giả định của bài kiểm tra.
Glen_b -Reinstate Monica

2

Cần phải hiểu rằng mục tiêu của ANOVA là kiểm tra xem có sự bất bình đẳng về phương tiện hay không ... điều này ngụ ý rằng chúng tôi quan tâm đến các biến thể lớn giữa các mẫu (và do đó có nghĩa là các biến thể được tính từ phương tiện) so với các biến thể trong các mẫu (một lần nữa tính từ trung bình mẫu cá nhân). Khi các biến thể giữa các mẫu là nhỏ (dẫn đến giá trị F nằm ở bên trái) thì không có vấn đề gì vì sự khác biệt này là không đáng kể. Các biến thể giữa các mẫu có vấn đề nếu nó cao hơn đáng kể so với các biến thể bên trong & trong trường hợp đó, giá trị F sẽ lớn hơn 1, và do đó ở đuôi phải.

Câu hỏi duy nhất còn lại là tại sao lại đặt toàn bộ mức ý nghĩa vào đuôi phải và câu trả lời lại tương tự. Việc từ chối chỉ xảy ra khi tỷ lệ F ở bên phải & không bao giờ khi tỷ lệ F ở bên trái. Mức ý nghĩa là thước đo lỗi do giới hạn thống kê. Vì sự từ chối chỉ xảy ra ở bên phải, toàn bộ mức ý nghĩa (rủi ro lỗi của loại trừ sai) được giữ ở bên phải. `


0

Giá trị dự kiến ​​cho Bình phương trung bình (MS) trong các phương pháp điều trị là phương sai dân số, trong khi giá trị dự kiến ​​cho MS giữa các phương pháp điều trị là phương sai dân số PLUS phương sai điều trị. Do đó, tỷ lệ F = MSb between / MSwithin luôn lớn hơn 1 và không bao giờ nhỏ hơn 1.

Vì độ chính xác của thử nghiệm 1 đuôi tốt hơn thử nghiệm 2 đuôi, chúng tôi thích sử dụng thử nghiệm 1 đuôi.


Tôi không tin rằng yêu cầu trong câu cuối của đoạn đầu tiên của bạn là chính xác ... E (tử số)> E (mẫu số) không ngụ ý rằng tử số> mẫu số.
Glen_b -Reinstate Monica

Ngoài quan điểm của Glen_b, tôi không chắc chắn về "vì độ chính xác của thử nghiệm 1 đuôi tốt hơn thử nghiệm 2 đuôi, chúng tôi thích sử dụng thử nghiệm 1 đuôi". Bạn có thể giải thích những gì bạn có ý nghĩa bởi điều này? Nói về độ chính xác dường như tôi bỏ lỡ điểm.
Cá bạc

Độ chính xác giống như khoảng tin cậy một nửa. Đối với cùng một chỉ số F, thử nghiệm 1 đuôi sẽ từ chối giả thuyết null với giá trị p nhỏ hơn (thực tế là một nửa). Theo cách khác, thử nghiệm 1 đuôi có thể bác bỏ giả thuyết khống với các giá trị nhỏ hơn của chỉ số F. Điều này ngụ ý rằng xét nghiệm 1 đuôi có thể phát hiện hiệu quả điều trị với ít mẫu hơn hoặc với phương sai nguyên nhân phổ biến hơn có trong mẫu. Điều này làm cho thử nghiệm 1 đuôi mong muốn hơn, nếu một người đang tìm kiếm một hiệu ứng.
Jeff Cotter

Có, thống kê F được tính toán có thể nhỏ hơn 1.0. Tuy nhiên, kết luận sẽ không thể bác bỏ giả thuyết khống về "không có tác dụng điều trị". Do đó, không có khu vực quan trọng ở phần dưới. Do đó, bài kiểm tra F là bài kiểm tra một phần trên. Trong ANOVA, đối số logic dựa trên các giá trị dự kiến ​​cho MS_treat và MS_error. Theo giả thuyết "không có hiệu quả điều trị", H0: E (MS_treat) = E (MS_error) = phương sai dân số. Bất kỳ hiệu quả điều trị đáng kể nào cũng dẫn đến HA: E (MS_treat)> E (MS_error). (Nguồn bất kỳ văn bản Montgomery bao gồm ANOVA). Do đó, HA ngụ ý thử nghiệm một đầu.
Jeff Cotter
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.