Làm thế nào để chức năng cắt bỏ chuột hoạt động?


9

Tôi đã tự hỏi liệu có ai có kinh nghiệm sử dụng chức năng của chuột không, như được mô tả trên chuột: Sự biến đổi đa biến theo phương trình xích trong R (JSS 2011 45 (3))? Tôi có một bộ dữ liệu với một số biến, mỗi biến có mức độ thiếu dữ liệu khác nhau.

Câu hỏi chính của tôi là: giả sử tôi sử dụng hồi quy tuyến tính Bayes để xử lý dữ liệu bị thiếu, có micetự động sử dụng các biến dự đoán từ quan trọng nhất đến ít quan trọng nhất để phản đối không? Ngoài ra, có phải là phổ biến để có thể trung bình tất cả các bộ dữ liệu được liệt kê?


Chào mọi người. Hơn nữa, tôi đã có thể sử dụng chức năng chuột thành công. Tôi có một truy vấn khác. Ví dụ, hàm tạo 5 bộ dữ liệu hoàn chỉnh (X1, X2 ... X5). Tôi áp dụng hàm (x) trên mỗi tập dữ liệu và nó trả về Y1, Y2 ... Y5. Bạn có nghĩ rằng có thể báo cáo phạm vi Ymin cho Ymax không? Hoặc có thể trung bình của Y1 đến Y5? Bất cứ ai có bất kỳ suy nghĩ về vấn đề này? Cảm ơn.
mjburns

Câu trả lời:


8

Theo mặc định, chuột sẽ sử dụng tất cả các biến trong bộ dữ liệu của bạn để dự đoán bất kỳ biến nào khác.

Đối với tính trung bình, bạn cần phải làm điều này sau khi tính toán số liệu thống kê của bạn, không phải trước đó. Chẳng hạn, nếu bạn muốn thực hiện hồi quy tuyến tính, bạn sẽ làm một cái gì đó như thế này:

library(mice)
mi <- mice(dataset)
mi.reg <- with(data=mi,exp=glm(y~x+z))
mi.reg.pool <- pool(mi.reg)
summary(mi.reg.pool)

Hàm tóm tắt sẽ hiển thị cho bạn các hệ số trung bình.


Cảm ơn vì điều đó - bạn có nói rằng tôi chỉ nên trung bình một khi tôi đã kiểm tra rằng các số liệu thống kê là "OK"? Ngoài ra - tập dữ liệu của tôi có 6 biến trong đó. Làm cách nào để phân tích số liệu thống kê bằng hồi quy tuyến tính? Tôi có phải kiểm tra từng biến riêng biệt không? Ví dụ: lm (x1 ~ x2 + x3 + x4 + x5 ....)
mjburns

Bạn phải tham khảo xác minh các giả định? Điều quan trọng nhất để kiểm tra là phần dư của mô hình của bạn (bao gồm tất cả các yếu tố dự đoán). Tôi có thể dính vào phân tích trường hợp hoàn chỉnh để thực hiện điều đó (trước nhiều lần cắt cụt), nhưng bạn có thể muốn xin lời khuyên từ một nhà thống kê có kinh nghiệm (mà tôi thì không).
Đaminh Comtois

1
@mjburns: Trong ví dụ của dominic999, tính trung bình là các hệ số kết quả từ việc khớp cùng một mô hình tuyến tính với từng phiên bản của nhiều tập dữ liệu được tính toán nhiều lần. Tôi không nghĩ rằng việc lấy trung bình các bộ dữ liệu là hợp lý, vì bạn sẽ mất đi sự biến đổi (hy vọng chính đáng và thực tế) mà nhiều lần đưa ra. Các thống kê tóm tắt cho các kết quả gộp (trung bình) tương tự như đối với một mô hình tuyến tính thông thường (ít nhất là về các hệ số), trong đó bạn phải xem xét Pr (> | t |) về tầm quan trọng của từng mô hình.
Wayne

Vui lòng xem xét bỏ phiếu lên / chấp nhận câu trả lời nếu nó phục vụ tốt mục đích của bạn.
Đaminh Comtois

Cảm ơn dominic999 và Wayne. Bây giờ tôi hiểu những gì đang diễn ra nhiều hơn sau khi làm theo gợi ý của bạn và chơi với dữ liệu nhiều hơn.
mjburns
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.