Làm thế nào có thể xử lý dữ liệu bị thiếu khi sử dụng spline hoặc đa thức phân số?


12

Tôi đang đọc Xây dựng mô hình đa biến: Cách tiếp cận thực dụng để phân tích hồi quy dựa trên đa thức phân số để mô hình hóa các biến liên tục của Patrick Royston và Willie Sauerbrei. Cho đến nay, tôi rất ấn tượng và đó là một cách tiếp cận thú vị mà tôi chưa từng xem xét trước đây.

Nhưng các tác giả không đối phó với dữ liệu bị thiếu. Thật vậy, trên p. 17 họ nói rằng dữ liệu còn thiếu "giới thiệu nhiều vấn đề khác. Không được xem xét ở đây."

Liệu nhiều thuật ngữ có hoạt động với đa thức phân số>

FP, theo một số cách (nhưng không phải tất cả) là một thay thế cho spline. Là nó dễ dàng hơn để đối phó với dữ liệu bị thiếu cho hồi quy spline?


Bạn đang đối phó với thiếu x hoặc thiếu y hoặc cả hai?
Glen_b -Reinstate Monica

2
+1 (!) Tôi thực sự vui mừng khi thấy người khác hỏi một câu hỏi tương tự. Gần đây tôi đã đăng câu hỏi này: stats.stackexchange.com/questions/295977/ trộm về cách sử dụng các khối vuông bị hạn chế trong chuột R. Tôi đặc biệt sẽ chọn các spline vì chúng không yêu cầu chỉ định một đa thức phân số trong khi các spline đủ linh hoạt cho nhiều dạng hàm. Tôi không biết liệu điều này trả lời câu hỏi của bạn mặc dù (do đó nhận xét này).
IWS

2
Đây là một câu hỏi thú vị, mở ra (như một chiều của một câu trả lời có thể) khả năng thực hiện một sự chỉ trích về một số kỹ thuật làm mịn / nội suy này bằng cách đối chiếu khả năng của chúng để chứa dữ liệu bị thiếu. (Ở một mức độ nào đó, sự mong manh đối với sự thiếu sót là một 'sự bối rối' đối với một phương pháp hiện đại.) Tôi chỉ lưu ý khi thông qua quan điểm rõ ràng rằng việc triển khai Bayes sẽ giúp bạn 'miễn phí'.
David C. Norris

2
@ DavidC.Norris Nhận xét của bạn khiến tôi thích thú! Bạn có thể giải thích về cách các phương thức Bayes chứa thiếu 'miễn phí' (mà tôi cho rằng bạn muốn nói là được xử lý bằng các phương pháp phân tích phù hợp, 'tự động' và như mặc định)? (Hoặc chỉ cho tôi một tài liệu tham khảo)
IWS

2
Phần không có bữa trưa miễn phí của "miễn phí" ở đây là bạn phải viết ra một mô hình Bayes, ngụ ý suy nghĩ rõ ràng về quá trình tạo dữ liệu ( DGP ). Khi bạn đã thực hiện điều đó, bạn coi các giá trị còn thiếu là tham số [phiền toái]. (Trong Bayesian, "mọi thứ đều là tham số". Xem thêm biến tiềm ẩn .) MCMC của bạn về cơ bản khai thác DGP mà bạn đã chỉ định để 'áp đặt' các giá trị còn thiếu "miễn phí" trong khi nó chạy theo.
David C. Norris

Câu trả lời:


1

f(x)f(x)=x+x.5fm()M1MmMfm(x)

Giả sử phần mềm bạn đang sử dụng có thể cung cấp ước tính lỗi tiêu chuẩn cho mọi giá trị duy nhất của x, bạn có thể sử dụng công thức Rubin (Nhiều lần xử lý cho phản hồi không phản hồi trong các khảo sát; 1987) để tính toán các lỗi tiêu chuẩn. Có các công thức mẫu nhỏ và lớn cho các mức độ tự do với nhiều lần cắt. Công thức mẫu lớn (cũng có trong Rubin) chỉ nhận các đầu vào giống như lỗi tiêu chuẩn, do đó cũng có thể được sử dụng. Trường hợp mẫu nhỏ lấy mức độ tự do của mô hình làm đầu vào; Tôi không rõ ràng nếu công thức này có thể được áp dụng ở đây.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.