Cách tốt nhất để làm điều này sẽ thay đổi rất nhiều tùy thuộc vào nhiệm vụ bạn đang thực hiện, vì vậy không thể nói điều gì sẽ tốt nhất theo cách độc lập với nhiệm vụ.
Có hai điều dễ dàng để thử nếu cấp độ của bạn là thứ tự:
- Bin họ. Ví dụ: 0 = (0 250), 1 = (251 500), v.v. Bạn có thể muốn chọn các giới hạn để mỗi thùng có số lượng mục bằng nhau.
- Bạn cũng có thể thực hiện chuyển đổi nhật ký của các cấp. Điều này sẽ squish phạm vi xuống.
Nếu các mức không theo thứ tự, bạn có thể phân cụm các cấp dựa trên các tính năng / biến khác trong tập dữ liệu của bạn và thay thế id cụm cho các cấp trước đó. Có nhiều cách để làm điều này như có các thuật toán phân cụm, vì vậy trường rộng mở. Khi tôi đọc nó, đây là những gì combine.levels()
đang làm. Bạn có thể làm tương tự bằng cách sử dụng kmeans()
hoặc prcomp()
. (Sau đó, bạn có thể / nên đào tạo một trình phân loại để dự đoán các cụm cho các điểm dữ liệu mới.)