Dữ liệu của tôi bao gồm một số phép đo liên tục và một số biến giả thể hiện số năm các phép đo đã được thực hiện. Bây giờ, tôi muốn tìm hiểu một mạng lưới thần kinh với dữ liệu. Do đó, tôi đang chuẩn hóa zScore tất cả các biến, bao gồm cả các biến giả. Tuy nhiên, tôi tự hỏi liệu đây có phải là một cách tiếp cận hợp lý hay không, bởi vì việc bình thường hóa các biến giả làm thay đổi phạm vi của chúng, điều mà tôi đoán làm cho chúng ít so sánh hơn nếu phân phối của chúng khác nhau. Mặt khác, việc không bình thường hóa các biến giả cũng có thể gây nghi ngờ, bởi vì nếu không bình thường hóa, ảnh hưởng của chúng đối với đầu ra của mạng có thể là tối ưu.
Cách tiếp cận tốt nhất để đối phó với các biến giả, bình thường hóa chúng (zScore) hoặc chỉ để chúng như vậy là gì?