Làm thế nào để giải thích giá trị F và p trong ANOVA?


40

Tôi chưa quen với số liệu thống kê và tôi hiện đang giao dịch với ANOVA. Tôi thực hiện kiểm tra ANOVA trong R bằng cách sử dụng

aov(dependendVar ~ IndependendVar)

Tôi nhận được - trong số những người khác - giá trị F và giá trị p.

Giả thuyết khống của tôi ( ) là tất cả các phương tiện nhóm đều bằng nhau.H0

Có rất nhiều thông tin có sẵn về cách tính F , nhưng tôi không biết cách đọc thống kê F và cách F và p được kết nối.

Vì vậy, câu hỏi của tôi là:

  1. Làm cách nào để xác định giá trị F quan trọng để từ chối ?H0
  2. Có phải mỗi F có một giá trị p tương ứng, vì vậy cả hai đều có nghĩa là giống nhau không? (ví dụ: nếu thì H 0 bị từ chối)p<0.05H0

1
Bạn đã thử các lệnh summary(aov(dependendVar ~ IndependendVar)))hay summary(lm(dependendVar ~ IndependendVar))chưa? Bạn có nghĩa là tất cả các nhóm có nghĩa là bằng nhau và bằng 0 hoặc chỉ với nhau?
RyanB

vâng, tôi đã thử summary(aov...). Cảm ơn vì lm.*, đã không biết về điều này :-) Tôi không hiểu ý của bạn bằng 0. Nếu đó là viết tắt của Giả thuyết 0 của tôi so với Giả thuyết sẽ cần một giá trị, và tôi đã không kiểm tra cụ thể, Vì vậy, trong trường hợp này: chỉ cho nhau!
JanD

1
Để giải thích trực quan, hãy xem blog Yhat về chủ đề hồi quy.
DataTx 22/03/2016

Câu trả lời:


14

Để trả lời câu hỏi của bạn:

  1. Bạn tìm thấy giá trị F quan trọng từ phân phối F (đây là bảng ). Xem một ví dụ . Bạn phải cẩn thận về một chiều so với hai chiều, mức độ tự do của tử số và mẫu số.

  2. Vâng.


Không có ý nghĩa gì khi nói về so sánh một hoặc hai chiều trong một bài kiểm tra omnibus như bài kiểm tra F.
Marcus Morrisey

3
Marcus Morrisey: Tôi nghĩ rằng bạn đang nhầm lẫn giữa một và hai đuôi với một hoặc hai chiều. Thử nghiệm F không có nhiều "đuôi" để lựa chọn, nhưng ANOVA một chiều so với ANOVA hai chiều cần được xem xét khi xây dựng thống kê kiểm tra.
Emiller

29

Thống kê F là tỷ lệ của 2 số đo phương sai khác nhau cho dữ liệu. Nếu giả thuyết null là đúng thì cả hai đều là ước tính của cùng một thứ và tỷ lệ sẽ ở khoảng 1.

Tử số được tính bằng cách đo phương sai của phương tiện và nếu phương tiện thực sự của các nhóm giống hệt nhau thì đây là một hàm của phương sai tổng thể của dữ liệu. Nhưng nếu giả thuyết null là sai và phương tiện không hoàn toàn bằng nhau, thì phương pháp này sẽ lớn hơn.

Mẫu số là trung bình của phương sai mẫu cho mỗi nhóm, là ước tính của phương sai tổng thể dân số (giả sử tất cả các nhóm có phương sai bằng nhau).

Vì vậy, khi null của tất cả các phương tiện đều bằng nhau thì 2 số đo (với một số điều khoản bổ sung cho bậc tự do) sẽ tương tự và tỷ lệ sẽ gần bằng 1. Nếu null là sai, thì tử số sẽ lớn hơn so với mẫu số và tỷ lệ sẽ lớn hơn 1. Tra cứu tỷ lệ này trên bảng F (hoặc tính toán nó với hàm như pf trong R) sẽ cho giá trị p.

Nếu bạn muốn sử dụng vùng loại bỏ hơn giá trị p, thì bạn có thể sử dụng bảng F hoặc hàm qf trong R (hoặc phần mềm khác). Phân phối F có 2 loại bậc tự do. Mức độ tự do của tử số dựa trên số lượng nhóm mà bạn đang so sánh (đối với 1 chiều là số nhóm trừ đi 1) và mức độ tự do của mẫu số dựa trên số lượng quan sát trong các nhóm (cho 1- cách nó là số lượng quan sát trừ đi số lượng nhóm). Đối với các mô hình phức tạp hơn, mức độ tự do trở nên phức tạp hơn, nhưng hãy làm theo các ý tưởng tương tự.


Cảm ơn đã giải thích! Tôi giả sử rằng nếu tôi có thể tra cứu giá trị F trên bảng để xem giá trị p, thì p và F chỉ là hai cách để biểu thị khả năng kết quả như phân tích có thể xảy ra nếu H0 đúng?
JanD

2
Trong tất cả các thống kê tham số có một liên kết chức năng trực tiếp giữa thống kê kiểm tra (F trong trường hợp này) và giá trị p. Chúng đã được đặt vào bàn để thuận tiện, nhưng cũng có thể được tính trực tiếp. Bạn có thể sử dụng alpha để tìm ra điểm giới hạn cho một khu vực quan trọng để so sánh thống kê kiểm tra với (mà tôi nghĩ là trực quan hơn) hoặc sử dụng thống kê kiểm tra được tính toán để tìm giá trị p để so sánh với alpha. Trong cả hai trường hợp, chúng tôi bắt đầu với cấp độ alpha và công thức thống kê kiểm tra theo phân phối đã cho khi null là đúng.
Greg Snow

20

Fp

nhập mô tả hình ảnh ở đây

FFFpFFpFp

Bạn sẽ nhận thấy một vài điều khác về phân phối theo giả thuyết null:

F

F

CCFCpp=0.175

FFdf1=3df1=2

nhập mô tả hình ảnh ở đây

Fχ2χ2Fχ2zFtt

Đó là nhiều hơn tôi định gõ, nhưng tôi hy vọng nó bao gồm các câu hỏi của bạn!

(Nếu bạn đang tự hỏi sơ đồ đến từ đâu, chúng sẽ tự động được tạo bởi gói thống kê máy tính để bàn của tôi, Wizard .)

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.