Làm thế nào để sử dụng spline khối bị hạn chế với gói cắt bỏ chuột R


8

Tôi đang tự hỏi làm thế nào để tích hợp các spline khối bị hạn chế (chẳng hạn như trong gói rms) trong các mô hình cắt cụt trong gói điều khiển chuột R.

Bối cảnh : Tôi đang thực hiện nghiên cứu y sinh và có quyền truy cập vào bộ dữ liệu bao gồm các đặc điểm và dữ liệu của bệnh nhân về tiến triển bệnh của bệnh nhân, bên cạnh kết quả sau khi chăm sóc y tế (ví dụ như sống sót sau một năm). Mục tiêu là xây dựng một mô hình dự đoán dựa trên đặc điểm của bệnh nhân và tiến triển bệnh để dự đoán sự xuất hiện của một số kết quả nhất định. Than ôi, một số bệnh nhân không có thông tin đầy đủ về tất cả các biến. Vì vậy, tôi đã quyết định sử dụng nhiều kỹ thuật cắt bỏ để ước tính (nhiều lần) những giá trị còn thiếu này sẽ là gì.

Vấn đề : Khi sử dụng nhiều lần cắt ngang, 'quy tắc' này được gọi là tính đồng nhất. Điều này có nghĩa là việc cắt bỏ đòi hỏi mô hình thống kê được sử dụng cho phân tích cuối cùng (tức là mô hình dự đoán mà tôi muốn nghiên cứu) cũng nên được đưa vào mô hình cắt cụt (tốt nhất là có thêm thông tin bổ sung vào nó). Điều này cũng có nghĩa là có tính đến các hiệp hội phi tuyến tính có thể. Vì tôi không biết liệu một số dự đoán nhất định có liên kết phi tuyến tính với các yếu tố khác hay không, tôi muốn các mô hình cắt cụt có thể phù hợp với các khối vuông bị hạn chế. Tuy nhiên, tôi không thực sự nắm bắt cách làm điều này ở chuột. Do đó, tôi muốn được giúp đỡ trong việc tạo ra các mô hình cắt cụt cho phép rcs, phù hợp với chuột.


Trên một sidenote cho bất kỳ người điều hành nào: Tôi nghĩ rằng câu hỏi này phù hợp với Crossvalidated vì sự cắt bỏ và spline là các chủ đề 'thống kê' cụ thể. Tuy nhiên, do tập trung vào bản chất lập trình của câu hỏi 'làm thế nào' này, tôi sẽ không bận tâm đến câu hỏi đang được di chuyển nếu bạn nghĩ rằng nó phù hợp hơn ở nơi khác. Trước nghi ngờ này, tôi cũng đã đăng câu hỏi này lên StackOverflow ( /programming/45674088/how-to-use-restricted-cubic-splines-with-the-r-mice-imputation-package )


2
Nếu bạn không nhận được bất kỳ phản hồi hữu ích nào, tôi sẽ thử gửi email cho người bảo trì gói và sau đó đăng câu trả lời cho câu hỏi của bạn tại đây. Tôi không nghĩ rằng bạn sẽ nhận được nhiều trợ giúp hơn về trợ giúp R ​​vì họ có thể cho rằng nó quá thống kê.
mdewey

1
@mdewey cảm ơn vì tiền boa; Tôi sẽ thử và quay lại nếu có bất cứ điều gì để hiển thị
IWS

2
Tôi đã thêm một tiền thưởng; nhưng, như tôi đã lưu ý, tôi nghĩ rằng điều này là hạn chế không cần thiết. Đó là, một câu hỏi lớn hơn là làm thế nào để đối phó với dữ liệu bị thiếu với splines. Có lẽ gói perturb sẽ tốt.
Peter Flom

1
@PeterFlom Cảm ơn bạn đã đặt tiền thưởng. Tôi sẽ thừa nhận yêu cầu chức năng cụ thể trong gói chuột đang giới hạn. Tôi sẽ xem xét gói nhiễu loạn để xem những gì tôi có thể học được từ nó. Như bạn đã đề xuất trong văn bản tiền thưởng, và trong câu hỏi của bạn ở đây: stats.stackexchange.com/questions/301017/ , có một câu trả lời chung cho dù các liên kết phi tuyến tính trong quá trình cắt bỏ có thêm vào việc xử lý dữ liệu bị thiếu hay không, rất đáng quan tâm.
IWS

Câu trả lời:


4

Bạn đã đúng rằng mô hình cắt cụt cần phải giàu hoặc giàu hơn mô hình kết quả. Thực tế là việc cắt bỏ dựa trên ước lượng và mức độ tối đa của khả năng tối đa được thực hiện bằng cách micegiả định tuyến tính ở mọi nơi là lý do chính khiến tôi viết hàm Hmiscgói R aregImpute, tạo ra các mô hình cắt ngang tự động bằng cách sử dụng các mô hình spline khối bị hạn chế phụ gia phong phú. Vì vậy, tuyến tính không được giả định cho nhiều lần cắt cụt. Cách tiếp cận mặc định trong aregImputelà kết hợp trung bình dự đoán, mà tôi thường thích hơn các cách tiếp cận tham số hơn (spline vẫn được sử dụng; PMM ít tham số hơn ở phía bên trái của các mô hình).

Giống như mice, aregImputesử dụng các phương trình xích. Không giống như mice, nó sử dụng các bản vẽ bootstrap thay vì xấp xỉ (giả sử tính quy tắc đa biến) Bayesian vẽ sau.


1
Tôi đã chấp nhận câu trả lời này bởi vì @ frank-harrel giải quyết một cách thích hợp việc xử lý các liên kết phi tuyến tính có thể có trong quá trình cắt bỏ trong cài đặt chung. Đối với những người quan tâm, tôi đã làm việc trên các mô hình cắt cụt (ví dụ PMM, hồi quy tuyến tính, hồi quy logistic) tương thích với gói chuột của R và cho phép các khối vuông bị hạn chế. Tôi sẽ đăng những điều này như một câu trả lời ở đây để hoàn thiện vì sau này, nhưng những mô hình này sẽ không được kiểm tra. Vì vậy, đối với những người có vấn đề tương tự, hãy xem và sử dụng aregImpute.
IWS

1
@IWS đó sẽ là một đóng góp tốt và bạn có thể tiếp tục thử nghiệm nó (bao gồm hiển thị kết quả giống hệt nhau micekhi sử dụng nút thắt số 0 (tuyến tính)) sẽ là một phần hay của gói R. Trong khi làm điều này, bạn có thể so sánh micearegImputemã để xem nơi micenào chậm một chút và có thể được tăng tốc.
Frank Harrell
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.