Mô hình diễn giải kết quả trung bình trong R


11

Tôi đang cố gắng để hiểu và biết những gì cần báo cáo từ phân tích của tôi về một số dữ liệu bằng cách sử dụng mô hình tính trung bình trong R.

Tôi đang sử dụng tập lệnh sau để phân tích hiệu quả của phương pháp đo trên một biến đã cho: Đây là tập dữ liệu: https://www.dropbox.com/s/u9un273gzw9o30u/VMT4.csv?dl=0

Mô hình được trang bị:

LM.1 <- gls(VMTf ~ turn+sex+method, na.action="na.fail", method = "ML",VMT4)

nạo vét mô hình đầy đủ

require(MuMIn)
d=dredge(LM.1)
print(d)
coefficients(d)

Có được thông tin tóm tắt của tất cả các mô hình để có được ước tính tham số

summary(model.avg(d))

Tôi biết rằng tất cả các mô hình có thể được tính trung bình (trung bình mô hình đầy đủ) hoặc chỉ là một tập hợp con của chúng (tính trung bình có điều kiện). Bây giờ, tôi muốn biết: khi nào tốt hơn là sử dụng tính trung bình đầy đủ hoặc có điều kiện để suy luận. Tôi nên báo cáo tất cả những điều này cho một bài báo khoa học? Điều gì có nghĩa chính xác giá trị Z và p liên quan cho tình huống trung bình mô hình?

Để làm cho nó dễ dàng hơn để hình dung các câu hỏi của tôi. Đây là bảng kết quả,

> summary(model.avg(d))# now, there are effects

Call:
model.avg(object = d)

Component model call: 
gls(model = VMT ~ <8 unique rhs>, data = VMT4, method = ML, na.action = 
 na.fail)

Component models: 
       df  logLik   AICc delta weight
1       4 -247.10 502.52  0.00   0.34
12      5 -246.17 502.83  0.31   0.29
13      5 -246.52 503.52  1.01   0.20
123     6 -245.60 503.88  1.36   0.17
(Null)  2 -258.62 521.33 18.81   0.00
3       3 -258.38 522.95 20.43   0.00
2       3 -258.60 523.39 20.88   0.00
23      4 -258.36 525.05 22.53   0.00

Term codes: 
method    sex   turn 
     1      2      3 

Model-averaged coefficients:  
(full average) 
                       Estimate Std. Error Adjusted SE z value Pr(>|z|)    
(Intercept)            42.63521    0.37170     0.37447 113.856  < 2e-16 ***
methodlight chamber    -1.05276    0.36098     0.36440   2.889  0.00386 ** 
methodthermal gradient -1.80567    0.36103     0.36445   4.955    7e-07 ***
sex2                    0.19023    0.29403     0.29548   0.644  0.51970    
turn                    0.05005    0.10083     0.10141   0.494  0.62165    

(conditional average) 
                       Estimate Std. Error Adjusted SE z value Pr(>|z|)    
(Intercept)             42.6352     0.3717      0.3745 113.856  < 2e-16 ***
methodlight chamber     -1.0528     0.3609      0.3643   2.890  0.00386 ** 
methodthermal gradient  -1.8058     0.3608      0.3642   4.958  7.1e-07 ***
sex2                     0.4144     0.3089      0.3119   1.328  0.18402    
turn                     0.1337     0.1264      0.1276   1.047  0.29492    
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

Relative variable importance: 
                     method sex  turn
Importance:          1.00   0.46 0.37
N containing models:    4      4    4

Câu trả lời:


5

Xem Grueber et al. 2011, "Suy luận đa mô hình trong sinh thái học và tiến hóa: những thách thức và giải pháp" Sinh học tiến hóa 24: 699-711.

Nó thực sự phụ thuộc vào mục tiêu là bạn muốn sử dụng dữ liệu đầy đủ hay có điều kiện. Trong lĩnh vực của tôi, chúng tôi sẽ sử dụng các tiêu chí, chẳng hạn như AICC để xác định mô hình nào được hỗ trợ nhiều nhất, sau đó sử dụng các mô hình đó làm tập hợp con có điều kiện của bạn. Thông tin này sau đó sẽ được báo cáo. Ví dụ: bốn mô hình đầu tiên của bạn đều nằm trong 2 đơn vị AIC của nhau, vì vậy tất cả chúng sẽ được bao gồm trong tập hợp con của bạn. Những người khác đang ở ngoài đó (AIC cao hơn) vì vậy bao gồm thông tin từ họ sẽ thực sự làm giảm chất lượng ước tính beta của bạn.


2
Ngay cả trong ví dụ được đề xuất của bạn, sẽ có một số thuật ngữ xuất hiện trong có thể hai trong số bốn mô hình "tốt nhất". Bạn có lấy giá trị trung bình của hai giá trị hệ số đó, hoặc của hai giá trị và hai giá trị 0 cho hai mô hình không xuất hiện không?
dùng2390246

5

Tôi nghĩ tiền đề về sự khác biệt giữa chính xác trung bình đầy đủ và trung bình có điều kiện là sai. Một là trung bình bao gồm số không (đầy đủ) và một không bao gồm số không (có điều kiện). từ tệp trợ giúp cho lệnh model.avg ():

Ghi chú

Trung bình 'tập hợp con' (hoặc 'có điều kiện') chỉ tính trung bình trên các mô hình xuất hiện tham số. Một cách khác, trung bình 'đầy đủ' giả định rằng một biến được bao gồm trong mọi mô hình, nhưng trong một số mô hình, hệ số tương ứng (và phương sai tương ứng của nó) được đặt thành không. Không giống như 'trung bình tập hợp con', nó không có xu hướng thiên vị giá trị từ 0. Trung bình 'đầy đủ' là một loại công cụ ước tính co rút và đối với các biến có mối quan hệ yếu với phản hồi, chúng nhỏ hơn công cụ ước tính 'tập hợp con'.

Nếu bạn muốn chỉ sử dụng một tập hợp con của các mô hình (ví dụ dựa trên delta AIC), hãy sử dụng đối số tập hợp con trong model.avg (). Bạn vẫn sẽ nhận được các ước tính có điều kiện và đầy đủ, miễn là một số mô hình được bao gồm thiếu một số biến mà các biến khác có.


Đúng. Tôi đồng ý. Đó là cách giải thích phù hợp.
nhà sinh thái học 1234
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.