Hồi quy từng bước làm thế nào


11

Tôi đã sử dụng mã R sau đây để phù hợp với mô hình probit:

p1 <- glm(natijeh ~ ., family=binomial(probit), data=data1)
stepwise(p1, direction='backward/forward', criterion='BIC')

Tôi muốn biết những gì làm stepwisebackward/forwardlàm chính xác và làm thế nào để chọn các biến?


7
Một số ý kiến ​​của Frank Harrell ( stats.stackexchange.com/users/4253/frank-harrell ) về lý do tại sao hồi quy từng bước là xấu: stata.com/support/faqs/statistic/stepwise-regression-probols

4
Ngoài các liên kết của BabakP, hãy xem bài đăng này từ trang web.
COOLSerdash

3
Một bài viết khác về các vấn đề với từng bước (và cả lùi và tiến) là một bài báo tôi đã viết với David Cassell: Dừng lại từng bước
Peter Flom - Tái lập Monica

@PeterFlom, để tham khảo bài viết này, tôi gặp một số vấn đề trong việc hiểu trích dẫn thích hợp. Bạn có thể vui lòng liệt kê nó ở đây? Cảm ơn.
doug.numbers

2
@ doug.numbers Nó đã được trình bày ở nhiều nơi và được xuất bản như một phần của thủ tục hội nghị. Nếu bạn Google "Flom, Cassell, Stepwise", bạn sẽ nhận được các địa điểm được trình bày và bạn có thể định dạng nó theo cách bạn định dạng trích dẫn cho các bài thuyết trình được xuất bản.
Peter Flom - Tái lập Monica

Câu trả lời:


10

Nguyên tắc lựa chọn từng bước

  1. Bạn phù hợp với một mô hình với tất cả các biến bạn muốn. Đây là mô hình tốt nhất hiện tại của bạn.
  2. Bạn loại bỏ một biến (hoặc thêm một, trong số một biến không được sử dụng trong mô hình tốt nhất hiện tại) và với mỗi biến, bạn phù hợp với mô hình mới và bạn so sánh chúng với từng biến và với biến ban đầu, theo BIC (hoặc bất kỳ tiêu chí khác, như AIC ). Bạn nhận được một "mô hình tốt nhất hiện tại".

Bạn lặp lại 2. cho đến khi không giảm BIC. Bạn chỉ có tối thiểu BIC cục bộ, điều đó có nghĩa là bạn có thể không có được mô hình tốt nhất trong số tất cả các lựa chọn tập hợp con của các biến. Nhưng dù sao, thường có quá nhiều người trong số họ, vì vậy đây là một cách để tối ưu hóa một chút, mà không cần quá nhiều công việc.

Xem thêm Hồi quy từng bướclựa chọn Mô hình trên Wikipedia.


5

Hồi quy từng bước về cơ bản phù hợp với mô hình hồi quy bằng cách thêm / bỏ đồng biến một lần dựa trên một tiêu chí xác định (trong ví dụ của bạn ở trên tiêu chí sẽ dựa trên BIC).

Bằng cách chỉ định về phía trước, bạn đang nói Rrằng bạn muốn bắt đầu với mô hình đơn giản nhất (nghĩa là một hiệp phương sai) và sau đó thêm một đồng biến một lần duy nhất chỉ giữ lại các mô hình dẫn đến cải tiến cho các mô hình BIC.

Bằng cách chỉ định lùi, bạn đang nói Rrằng bạn muốn bắt đầu với mô hình đầy đủ (nghĩa là mô hình với tất cả các đồng biến) và sau đó thả đồng biến, một lúc, điều đó dẫn đến sự cải thiện trong BIC.

Hồi quy từng bước có thể là một thủ tục thống kê rất nguy hiểm vì nó không phải là một quy trình lựa chọn mô hình tối ưu. Phương pháp này có thể dẫn đến lựa chọn mô hình rất kém bởi vì và nó không bảo vệ bạn trước các vấn đề như so sánh nhiều.


Cảm ơn. Và còn 'lùi / tiến' thì sao?
Mahmoud

Bạn có ý nghĩa gì về lùi / tiến?

Một trong những phương pháp của stpewise () trong R là 'lùi / tiến'! Nó là sự kết hợp của cả hai?
Mahmoud

2
Oh xin lỗi, bây giờ tôi hiểu những gì bạn đang hỏi. Có, nếu bạn chỉ định cả hai thì nó áp dụng cả tiến và lùi và chọn cái có tiêu chí tốt nhất.
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.