Tôi đang xây dựng một mô hình và tôi nghĩ rằng vị trí địa lý có khả năng rất tốt trong việc dự đoán biến mục tiêu của tôi. Tôi có mã zip của mỗi người dùng của tôi. Tôi không hoàn toàn chắc chắn về cách tốt nhất để bao gồm mã zip như một tính năng dự đoán trong mô hình của tôi. Mặc dù mã zip là một số, nhưng nó không có nghĩa gì nếu số đó tăng hoặc giảm. Tôi có thể mã hóa tất cả 30.000 mã zip và sau đó bao gồm chúng dưới dạng các tính năng hoặc cột mới (ví dụ: {user_1: {61822: 1, 62118: 0, 62444: 0, v.v.}}. Tuy nhiên, điều này có vẻ như sẽ thêm một tấn các tính năng cho mô hình của tôi.
Bất kỳ suy nghĩ về cách tốt nhất để xử lý tình huống này?