Điều chỉnh đường hồi quy mạnh bằng công cụ ước lượng MM trong R


8

Bối cảnh. Tôi muốn điều chỉnh một đường hồi quy để nghiên cứu mối quan hệ giữa một số biến trả lời và một số biến số liên tục . Do sự hiện diện của các điểm đòn bẩy xấu, tôi đã chọn công cụ ước tính MM thay vì công cụ ước tính LS thông thường.yx

Phương pháp luận. Về cơ bản, ước lượng MM là ước lượng M được khởi tạo bởi một công cụ ước tính S. Do đó, hai chức năng mất phải được chọn. Tôi đã chọn chức năng mất Tukey Bi weight được sử dụng rộng rãi

ρ(bạn)= ={1-[1-(bạnk)2]3nếu |bạn|k1nếu |bạn|>k,

với tại công cụ ước tính S sơ bộ (cung cấp điểm phân tích bằng ) và với ở bước ước tính M (để đảm bảo hiệu suất Gaussian ).k= =1.54850%k= =2,69770%

Tôi muốn sử dụng R để phù hợp với đường hồi quy mạnh mẽ của mình.

Câu hỏi.

library(MASS)
rlm(y~x, 
    method="MM",
    k0=1.548, c=2.697,
    maxit=50)
  • Mã của tôi có phù hợp với đoạn trước không?
  • Bạn sẽ sử dụng các đối số tùy chọn khác?

BIÊN TẬP. Sau cuộc thảo luận của tôi với @Jason Morgan, tôi nhận ra rằng mã trước đây của tôi là sai. (@Jason Morgan: Cảm ơn bạn rất nhiều vì điều này!) Tuy nhiên, tôi vẫn không bị thuyết phục bởi đề xuất của anh ấy. Thay vào đó, đây là những gì tôi đề xuất bây giờ:

library(robustbase)
lmrob(y~x, 
      tuning.chi=1.548, tuning.psi=2.697)

Tôi nghĩ rằng nó dính vào phương pháp bây giờ. Bạn có đồng ý không?

Cảm ơn!

Câu trả lời:


5

Theo mặc định, tài liệu chỉ ra rằng rlmsử dụng psi=psi.hubertrọng lượng. Vì vậy, nếu bạn muốn sử dụng hình chữ nhật của Tukey, bạn cần chỉ định psi=psi.bisquare. Các cài đặt mặc định là psi.bisquare(u, c = 4.685, deriv = 0), bạn có thể thay đổi theo ý muốn. Ví dụ, có thể một cái gì đó như

rlm(x ~ y, method="MM", psi=psi.bisquare, maxit=50)

Bạn cũng có thể muốn điều tra xem bạn có nên sử dụng các ô vuông được cắt bớt ( init="lts") để khởi tạo các giá trị bắt đầu của mình hay không. Mặc định là sử dụng bình phương tối thiểu.


@Janson Morgan: bạn có chắc chắn về những gì bạn đưa ra? Bạn có bất kỳ kinh nghiệm với chức năng đó? Tài liệu của tôi (R 2.13.1) thực sự chỉ ra "Tập hợp các hệ số ban đầu và thang đo cuối cùng được chọn bởi một công cụ ước tính S với k0 = 1,548; điều này mang lại (cho n >> p) điểm phân tích 0,5. Công cụ ước tính cuối cùng là một Công cụ ước tính M với thang đo cố định và cân nặng của Tukey sẽ kế thừa điểm phân tích này với điều kiện c> k0; điều này đúng với giá trị mặc định của c tương ứng với hiệu suất tương đối 95% ở mức bình thường. "
ocram

1
Tôi đã ước tính những mô hình này trong quá khứ. Như tài liệu nêu rõ, bước đầu tiên trong ước tính MM được thực hiện với trọng số Huber, bước thứ hai với trọng số bisquared. Ghi chú của tôi (từ một vài năm trước) nói rằng trong bước S đầu tiên, bạn có thể sử dụng trọng số hai chiều thay vì trọng lượng Huber nếu bạn chỉ định psiphù hợp. Tôi có thể sẽ để cmặc định bắt đầu bằng (tôi sẽ sửa đổi câu trả lời của mình cho phù hợp).
Jason Morgan

1
Tôi cũng sử dụng rlm và sử dụng hàm psi bisapes vì ​​thuộc tính giảm dần của nó. Tuy nhiên, đôi khi có những vấn đề hội tụ với nó, đặc biệt là với các mẫu nhỏ hơn.
jbowman
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.