bình phương nhỏ nhất phi tuyến so với khả năng tối đa trong R, nls () hoặc nlm ()?


7

Tôi đang ước lượng mô hình

E(Y|X)=Pr(Y=1|X)=α0+(1α0α1)ϕ(Xβ),
Ở đâu α0α1 là các tham số, β là một pvectơ chiều dài của các tham số, X là một p×n ma trận dữ liệu, Y biến phụ thuộc là nhị phân và ϕ()là một mô hình probit, vì vậy hàm phân phối tích lũy của phân phối chuẩn thông thường. Để đạt được kỳ vọng, giả định đã được đưa ra rằng các lỗi là bình thường và có nghĩa là không.

Nguồn của mô hình là ở đây (xem phương trình 6 và 7), và theo bài báo tôi có thể ước tính mô hình thông qua bình phương tối thiểu phi tuyến hoặc khả năng tối đa. Tôi đã thử cả hai cách tiếp cận trong R, sử dụng nls()hàm cho bình phương nhỏ nhất phi tuyến và nlm()hàm cho khả năng tối đa. Thử nghiệm cho thấy kết quả rất giống với ứng dụng của tôi, nhưng nls()nhanh hơn. Có một lý do để ủng hộ một cách tiếp cận hơn các phương pháp khác? Tôi nên nghĩ như thế nào về việc chọn một phương pháp, ví dụ như thực hiện các giả định tương tự theo cả hai cách tiếp cận?

Bất kỳ đề xuất nào để suy nghĩ thông qua sự khác biệt giữa hai phương pháp này, hoặc đề xuất cho các tài liệu liên quan để tham khảo ý kiến ​​sẽ được đánh giá rất cao.


Liên quan đến giải pháp nhanh hơn, bạn có đảm bảo rằng nls và nlm sử dụng cùng một trình tối ưu hóa không? Nếu bạn sử dụng máy đo thị lực khác nhau có thể giải thích tại sao cái này sẽ nhanh hơn cái kia.
dự báo

Câu hỏi hay. Tôi đã không kiểm tra điều đó - tôi sẽ điều tra. Tốc độ không quá quan trọng trong ứng dụng của tôi đến nỗi tôi sẽ không thích sử dụng một trong hai mô hình. Tôi quan tâm hơn đến việc liệu có lý do lý thuyết nào để thích cái này hơn cái kia không.
gfgm

Loại biến là gì y? Có phải là số, phân loại, nhị phân, vv? Những gì làφ? Và mô hình thống kê của bạn là gì? Những gì bạn đã viết không phải là một mô hình - không có thuật ngữ lỗi. Nhiều nhất, nó có thể là một biểu thức cho trung bình có điều kiện củay đối với x. Nếuylà một biến ngẫu nhiên liên tục và bạn giả sử các lỗi Gaussian cộng gộp với giá trị trung bình bằng 0 và phương sai không đổi, thì công cụ ước tính NLS và công cụ ước tính MLE là như nhau.
DeltaIV

Cảm ơn @DeltaIV, tôi đã chỉnh sửa bài đăng để làm cho nó rõ ràng hơn. Nó là biểu thức của giá trị trung bình có điều kiện của y đối với x khi bạn phỏng đoán và y là nhị phân.
gfgm

Câu trả lời:


6

Để đạt được kỳ vọng, giả định đã được đưa ra rằng các lỗi là bình thường và có nghĩa là không.

Nếu đó là giả định của bạn, MLE và NLS phải giống hệt nhau về mặt toán học và sự khác biệt có thể sẽ được giải thích bằng sự lựa chọn / cài đặt của trình tối ưu hóa.

Liệu một phân phối bình thường cho một phản ứng nhị phân là một ý tưởng tốt là một câu hỏi khác. Một thay thế sẽ là một glm logistic với dự đoán phi tuyến của bạn, ước tính với MLE.

Nếu bạn làm MLE, bạn có thể muốn xem xét sử dụng https://cran.r-project.org/web/packages/bbmle/index.html thay vì nlm (), nhiều tùy chọn hơn cho các TCTD, v.v.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.