Logic đằng sau bài kiểm tra ANOVA F trong hồi quy tuyến tính đơn giản

Tôi đang cố gắng hiểu logic đằng sau bài kiểm tra ANOVA F trong Phân tích hồi quy tuyến tính đơn giản. Câu hỏi tôi có như sau. Khi giá trị F, tức MSR/MSElà lớn, chúng tôi chấp nhận mô hình là đáng kể. Logic đằng sau này là gì?

regression anova

— Không thể nói
nguồn

@ Can'tTell Bạn có thể tìm thấy một số giúp đỡ về định dạng ở đây: stats.stackexchange.com/editing-help

Trong trường hợp đơn giản nhất, khi bạn chỉ có một yếu tố dự đoán (hồi quy đơn giản), giả sử , -test sẽ cho bạn biết liệu có giải thích phần lớn hơn của phương sai quan sát được trong so với mô hình null (chỉ chặn). Sau đó, ý tưởng là kiểm tra xem phương sai được giải thích thêm (tổng phương sai, TSS, trừ phương sai dư, RSS) có đủ lớn để được coi là "số lượng đáng kể" hay không. Chúng ta ở đây so sánh một mô hình với một yếu tố dự đoán hoặc biến giải thích, với một đường cơ sở chỉ là "nhiễu" (không có gì ngoại trừ ý nghĩa lớn). $X_1$ $F$ $X_1$ $Y$

Tương tự như vậy, bạn có thể tính toán thống kê trong cài đặt hồi quy bội: Trong trường hợp này, nó sẽ kiểm tra tất cả các dự đoán có trong mô hình, trong khung HT có nghĩa là chúng tôi tự hỏi liệu có bất kỳ trong số chúng có hữu ích trong việc dự đoán đáp ứng không Biến đổi. Đây là lý do tại sao bạn có thể gặp phải tình huống trong đó -test cho toàn bộ mô hình là đáng kể trong khi một số thử nghiệm hoặc liên quan đến từng hệ số hồi quy thì không. $F$ $F$ $t$ $z$

Các Thống kê trông giống như $F$

F = \frac{(TSS - RSS) / (p - 1)}{RSS / (n - p)},

$F = \frac{(\text{TSS}-\text{RSS})/(p-1)}{\text{RSS}/(n-p)},$

Trong đó là số lượng tham số mô hình và số lượng quan sát. Số lượng này phải được tham chiếu đến một bản phân phối cho giá trị quan trọng hoặc giá trị . Nó cũng áp dụng cho mô hình hồi quy đơn giản và rõ ràng có một số điểm tương đồng với khung ANOVA cổ điển. $p$ $n$ $F_{p-1,n-p}$ $p$

Sidenote. Khi bạn có nhiều hơn một yếu tố dự báo, thì bạn có thể tự hỏi liệu chỉ xem xét một tập hợp con của những yếu tố dự đoán đó có làm "giảm" chất lượng của mô hình phù hợp hay không. Điều này tương ứng với một tình huống mà chúng ta xem xét các mô hình lồng nhau . Đây chính xác là tình huống tương tự như các trường hợp trên, trong đó chúng ta so sánh một mô hình hồi quy đã cho với một mô hình null (không bao gồm các yếu tố dự đoán). Để đánh giá mức giảm phương sai được giải thích, chúng ta có thể so sánh tổng bình phương còn lại (RSS) từ cả hai mô hình (nghĩa là, phần còn lại không giải thích được khi bạn tính đến tác động của các yếu tố dự đoán có trong mô hình). Đặt và biểu thị mô hình cơ sở (với $\mathcal{M}_0$ $\mathcal{M}_1$ $p$ tham số) và một mô hình có bộ dự đoán bổ sung ( tham số), sau đó nếu là nhỏ, chúng tôi sẽ xem xét rằng mô hình nhỏ hơn hoạt động tốt như mô hình lớn hơn. Một thống kê tốt để sử dụng sẽ tỷ lệ của SS đó, , được tính theo mức độ tự do của chúng ( cho tử số và cho mẫu số). Như đã nói, có thể chỉ ra rằng đại lượng này tuân theo phân phối (hoặc Fisher-Snedecor) với mức độ tự do và . Nếu quan sát $q=p+1$ $\text{RSS}_{\mathcal{M}_1}-\text{RSS}_{\mathcal{M}_0}$ $(\text{RSS}_{\mathcal{M}_1}-\text{RSS}_{\mathcal{M}_0})/\text{RSS}_{\mathcal{M}_0}$ $p-q$ $n-p$ $F$ $p-q$ $n-p$ $F$ lớn hơn lượng tử tương ứng tại một (thông thường, ), sau đó chúng tôi sẽ kết luận rằng mô hình lớn hơn tạo ra "công việc tốt hơn". (Điều này không có nghĩa là mô hình là chính xác, từ quan điểm thực tế!) $F$ $\alpha$ $\alpha=0.05$

Một khái quát của ý tưởng trên là thử nghiệm tỷ lệ khả năng .

Nếu bạn đang sử dụng R, bạn có thể chơi với các khái niệm trên như sau:

df <- transform(X <- as.data.frame(replicate(2, rnorm(100))), 
                                   y = V1+V2+rnorm(100))
## simple regression
anova(lm(y ~ V1, df))         # "ANOVA view"
summary(lm(y ~ V1, df))       # "Regression view"
## multiple regression
summary(lm0 <- lm(y ~ ., df))
lm1 <- update(lm0, . ~ . -V2) # reduced model
anova(lm1, lm0)               # test of V2

— chl
nguồn

@chl - Trước hết, câu trả lời hay! Điều này có thể đảm bảo câu hỏi của riêng nó vì vậy hãy cho tôi biết ... nhưng các mô tả tôi đã đọc về các bảng ANOVA cho các mô hình hồi quy thường đề cập đến ba hàng trong bảng: dự đoán, lỗi và tổng. Tuy nhiên, anova()hàm trong R trả về một hàng riêng cho từng bộ dự đoán trong mô hình. Ví dụ, anova(lm0)trên trả về một hàng cho V1, V2và Residuals(và tổng số không). Như vậy, chúng tôi nhận được hai thống kê F * cho mô hình này. Làm thế nào điều này thay đổi cách giải thích của thống kê F * được báo cáo trong bảng ANOVA?

— Đuổi theo

@Chase Có, Bảng ANOVA tôi có trong đầu cũng được sắp xếp theo cách này. Hãy đặt câu hỏi; Tôi muốn nghe những gì người dùng khác nghĩ về điều đó. Tôi thường sử dụng anova()để so sánh GLM. Khi được áp dụng cho một lmhoặc một aovđối tượng, nó sẽ hiển thị các hiệu ứng riêng biệt (SS) cho từng thuật ngữ trong mô hình và không hiển thị TSS. (Tôi sử dụng để áp dụng điều này cách khác xung quanh, cụ thể là sau khi lắp một ANOVA với aov(), tôi có thể sử dụng summary.lm()để có được một ý tưởng về sự tương phản điều trị.) Tuy nhiên, đang có những vấn đề tế nhị giữa summary.lm()và summary.aov(), đặc biệt là liên quan đến phù hợp tuần tự.

— chl

@Chase tôi chỉ tái phát hiện này đáp ứng rất tốt đẹp từ @Gavin về Giải thích lm R () của đầu ra .

— chl

@chl - Một chút nitpicking từ tôi. Đó là một câu trả lời hay về trực giác đằng sau bài kiểm tra F và cách nó "đi đúng hướng". Nhưng nó không giải thích logic của lý do tại sao bạn nên chọn thử nghiệm cụ thể này. Ví dụ, tại sao chúng ta không nên sử dụng thống kê PRESS? Bạn ám chỉ tỷ lệ khả năng - mà không có một biện minh logic - do đó khả năng ứng dụng của mình cho tất cả các mô hình, không giống như F-test.

— xác suất

@probabilityislogic Điểm tốt. Ý tưởng của tôi ban đầu là chỉ ra logic đằng sau so sánh mô hình, trong đó mô hình hồi quy đơn giản chỉ là một trường hợp cụ thể (so với mô hình "rất null"), điều này cũng thúc đẩy ghi chú nhanh về LRT. Tôi đồng ý với bạn, nếu chúng tôi làm việc theo hướng tiếp cận thuần túy của Neyman-Pearson cho HT. Tuy nhiên, tôi chủ yếu suy nghĩ về Lý thuyết LM, trong đó SS có một diễn giải hình học trực tiếp và trong đó so sánh mô hình hoặc thử nghiệm F đơn cho ANOVA một chiều (...)

— chl