Tôi đang cố gắng xây dựng một Regression
mô hình và tôi đang tìm cách để kiểm tra xem liệu có bất kỳ mối tương quan nào giữa các tính năng và các biến mục tiêu không?
Đây là mẫu của tôi dataset
Loan_ID Gender Married Dependents Education Self_Employed ApplicantIncome\
0 LP001002 Male No 0 Graduate No 5849
1 LP001003 Male Yes 1 Graduate No 4583
2 LP001005 Male Yes 0 Graduate Yes 3000
3 LP001006 Male Yes 0 Not Graduate No 2583
4 LP001008 Male No 0 Graduate No 6000
CoapplicantIncome LoanAmount Loan_Amount_Term Credit_History Area Loan_Status
0.0 123 360.0 1.0 Urban Y
1508.0 128.0 360.0 1.0 Rural N
0.0 66.0 360.0 1.0 Urban Y
2358.0 120.0 360.0 1.0 Urban Y
0.0 141.0 360.0 1.0 Urban Y
Tôi đang cố gắng dự đoán LoanAmount
cột dựa trên các tính năng có sẵn ở trên.
Tôi chỉ muốn xem liệu có mối tương quan giữa các tính năng và biến mục tiêu hay không. Tôi đã thử LinearRegression
, GradientBoostingRegressor
và tôi hầu như không nhận được độ chính xác xung quanh 0.30 - 0.40%
.
Bất kỳ đề xuất về thuật toán, params vv mà tôi nên sử dụng để dự đoán tốt hơn?