Đánh giá mô hình hồi quy logistic

Câu hỏi này xuất phát từ sự nhầm lẫn thực tế của tôi về cách quyết định xem một mô hình logistic có đủ tốt hay không. Tôi có các mô hình sử dụng trạng thái của các cặp dự án riêng lẻ hai năm sau khi chúng được hình thành như một biến phụ thuộc. Kết quả có thành công (1) hay không (0). Tôi có các biến độc lập được đo tại thời điểm hình thành các cặp. Mục đích của tôi là kiểm tra xem một biến, mà tôi đưa ra giả thuyết có ảnh hưởng đến sự thành công của các cặp có ảnh hưởng đến thành công đó hay không, kiểm soát các ảnh hưởng tiềm năng khác. Trong các mô hình, các biến quan tâm là đáng kể.

Các mô hình đã được ước tính bằng cách sử dụng glm()chức năng trong R. Để đánh giá chất lượng của các mô hình, tôi đã thực hiện một vài điều: glm()cung cấp cho bạn residual deviance, các AICvà BICtheo mặc định. Ngoài ra, tôi đã tính tỷ lệ lỗi của mô hình và vẽ các phần dư có giá trị.

Mô hình hoàn chỉnh có độ lệch dư nhỏ hơn, AIC và BIC so với các mô hình khác mà tôi đã ước tính (và được lồng trong mô hình hoàn chỉnh), điều này khiến tôi nghĩ rằng mô hình này "tốt hơn" so với các mô hình khác.
Tỷ lệ lỗi của mô hình khá thấp, IMHO (như trong Gelman và Hill, 2007, tr.99 ) :
error.rate <- mean((predicted>0.5 & y==0) | (predicted<0.5 & y==1), ở mức khoảng 20%.

Càng xa càng tốt. Nhưng khi tôi vẽ phần dư còn lại (một lần nữa theo lời khuyên của Gelman và Hill), một phần lớn các thùng nằm ngoài 95% CI: Âm mưu của Binned Residuals

Cốt truyện đó khiến tôi nghĩ rằng có một cái gì đó hoàn toàn sai về mô hình. Điều đó có nên dẫn tôi ném mô hình đi? Tôi có nên thừa nhận rằng mô hình là không hoàn hảo nhưng giữ nó và giải thích ảnh hưởng của biến quan tâm? Tôi đã lần lượt đùa giỡn với việc loại trừ các biến, và một số biến đổi, mà không thực sự cải thiện âm mưu dư thừa.

Biên tập:

Hiện tại, mô hình có hàng tá dự đoán và 5 hiệu ứng tương tác.
Các cặp "tương đối" độc lập với nhau theo nghĩa là tất cả chúng được hình thành trong một khoảng thời gian ngắn (nhưng không nói một cách nghiêm túc, tất cả đồng thời) và có rất nhiều dự án (13k) và rất nhiều cá nhân (19k) ), do đó, một tỷ lệ hợp lý các dự án chỉ được tham gia bởi một cá nhân (có khoảng 20000 cặp).

r logistic goodness-of-fit residuals

— Antoine Vernet
nguồn

Ước tính sơ bộ về cỡ mẫu tối thiểu cần thiết để thực hiện những gì bạn đang làm là bạn cần tối thiểu số lượng sự kiện hoặc số lượng sự kiện không vượt quá 15 lần (12 + 5), giả sử bạn có 17 điều khoản ứng cử viên trong ngươi mâu. Nếu bạn thực hiện bất kỳ sàng lọc dự đoán nào, sử dụng , tất cả các cược sẽ bị tắt.

Y

$Y$

— Frank Harrell

Dựa trên những gì bạn nói, kích thước mẫu dường như không phải là vấn đề, bởi vì tôi có khoảng 20000 nghìn cặp (trong đó khoảng 20% là thành công).

— Antoine Vernet

Câu trả lời:

Độ chính xác phân loại (tỷ lệ lỗi) là một quy tắc chấm điểm không phù hợp (được tối ưu hóa bởi mô hình không có thật), tùy ý, không liên tục và dễ thao tác. Nó không cần thiết trong bối cảnh này.

Bạn đã không nói có bao nhiêu dự đoán. Thay vì đánh giá sự phù hợp với mô hình, tôi sẽ chỉ muốn làm cho mô hình phù hợp. Một cách tiếp cận thỏa hiệp là giả định rằng các tương tác không quan trọng và cho phép các yếu tố dự đoán liên tục là phi tuyến bằng cách sử dụng các hàm hồi quy. Vẽ các mối quan hệ ước tính. Các rmsgói vào R làm tất cả điều này tương đối dễ dàng. Xem http://biostat.mc.vanderbilt.edu/rms để biết thêm thông tin.

Bạn có thể giải thích "cặp" và liệu các quan sát của bạn có độc lập hay không.

— Frank Mitchell
nguồn

Nếu tôi hiểu chính xác, lời khuyên của bạn là tập trung vào cốt truyện của phần dư và làm cho cái này thẳng trước khi làm bất cứ điều gì khác, cuối cùng sử dụng spline hồi quy, tôi có đúng không? Tôi đã chỉnh sửa câu hỏi để cho biết có bao nhiêu dự đoán và các cặp này "độc lập" tương đối.

— Antoine Vernet

Xin chào @Frank. Tại sao bạn nói độ chính xác phân loại là một phương pháp xấu? Có phải bởi vì nó ở đây, được đánh giá trên cùng một dữ liệu mà mô hình được dẫn xuất?

— Peter Flom - Tái lập Monica

χ^{2}

$\chi^2$

c

$c$

Không, ý tôi là cho phép các công cụ dự đoán liên tục hoạt động phi tuyến theo thang tỷ lệ cược log, bằng cách mở rộng chúng thành nhiều thuật ngữ bằng cách sử dụng các spline khối bị hạn chế (spline tự nhiên). Sau đó, vẽ các biến đổi ước tính để tìm hiểu về các hiệu ứng từng phần của từng yếu tố dự đoán.

— Frank Harrell

Cảm ơn cho đầu vào, điều đó thực sự hữu ích. Đi sâu hơn vào dữ liệu, tôi nhận ra rằng tôi có vấn đề về cộng tuyến (ngay cả khi tôi không có mối tương quan cặp đôi cao).

— Antoine Vernet

$x^2$

— gung - Phục hồi Monica
nguồn