Tôi có một câu hỏi về cách một nhà thống kê thường diễn giải một đầu ra anova. Nói rằng tôi có đầu ra anova từ R.
> summary(fitted_data)
Call:
lm(formula = V1 ~ V2)
Residuals:
Min 1Q Median 3Q Max
-2.74004 -0.33827 0.04062 0.44064 1.22737
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 2.11405 0.32089 6.588 1.3e-09 ***
V2 0.03883 0.01277 3.040 0.00292 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.6231 on 118 degrees of freedom
Multiple R-squared: 0.07262, Adjusted R-squared: 0.06476
F-statistic: 9.24 on 1 and 118 DF, p-value: 0.002917
> anova(fit)
Analysis of Variance Table
Response: V1
Df Sum Sq Mean Sq F value Pr(>F)
V2 1 3.588 3.5878 9.2402 0.002917 **
Residuals 118 45.818 0.3883
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Từ những điều trên, tôi đoán giá trị quan trọng nhất là Pr (> F), phải không? Vì vậy, Pr này, là ít hơn 0,05 (mức 95%). Làm thế nào để tôi "giải thích" điều này? Tôi có giải thích điều đó trong "liên kết" không, tức là V2 và V1 có liên quan (hoặc không)? hoặc về mặt "ý nghĩa"? Tôi luôn cảm thấy rằng tôi không thể hiểu được khi mọi người nói "Giá trị này rất đáng kể ....". Vậy "đáng kể" là gì? Có một hình thức giải thích trực quan hơn? kiểu như "Tôi tin tưởng 95% rằng ....".
Ngoài ra, giá trị Pr có phải là thông tin quan trọng duy nhất không? hoặc tôi cũng có thể nhìn vào phần dư và phần còn lại của đầu ra để "giải thích" kết quả? cảm ơn
fitted_data