Là dữ liệu "thiếu" theo nghĩa là không xác định hoặc nó chỉ có nghĩa là không có khoản vay (vì vậy số tiền cho vay bằng không)? Nghe có vẻ như sau này, trong trường hợp bạn cần một hình nộm nhị phân bổ sung để cho biết liệu có một khoản vay. Không cần chuyển đổi số tiền cho vay (ngoài ra, có lẽ, từ một biểu hiện lại liên tục, chẳng hạn như một bản ghi gốc hoặc nhật ký bắt đầu, có thể được biểu thị bằng các cân nhắc khác).
Điều này hoạt động tốt trong một hồi quy. Một ví dụ đơn giản là một mô hình khái niệm của mẫu
dependent variable (Y) = loan amount (X) + constant.
Với việc bổ sung chỉ số cho vay ( ), mô hình hồi quy làI
Y=βII+βXX+β0+ϵ
với lỗi đại diện ngẫu nhiên với không mong đợi. Các hệ số được hiểu là:ϵ
là kỳ vọng của Y đối với các tình huống không cho vay, bởi vì các trường hợp này được đặc trưng bởi X = 0 và I = 0 .β0YX=0I=0
là sự thay đổi bên lề trong Y đối với số tiền vay (với X ).βXYX
là đánh chặn các trường hợp với các khoản vay.βI+β0