Tôi đang suy nghĩ về một vấn đề là dự đoán nhật ký (chi tiêu) của khách hàng bằng cách sử dụng hồi quy tuyến tính.
Tôi đang xem xét những tính năng nào được sử dụng làm đầu vào và tự hỏi liệu có ổn không khi sử dụng phần trăm của một biến làm đầu vào.
Ví dụ, tôi có thể sử dụng doanh thu của các công ty làm đầu vào. Điều tôi băn khoăn là liệu tôi có thể sử dụng phần trăm doanh thu của công ty thay thế hay không.
Một ví dụ khác là phân loại ngành công nghiệp phân loại (NAICS) - nếu tôi xem xét chi tiêu trung bình cho mỗi mã NAICS và sau đó gán từng mã NAICS cho Perc Phần trăm NAICS ', đó có phải là biến giải thích hợp lệ tôi có thể sử dụng không?
Chỉ tự hỏi nếu có bất kỳ vấn đề cần lưu ý khi sử dụng phần trăm? Có phải trong một số cách tương đương với một loại quy mô tính năng?