Vấn đề đề cập đến việc xây dựng cây quyết định. Theo Wikipedia ' Hệ số Gini ' không nên bị nhầm lẫn với ' tạp chất Gini '. Tuy nhiên cả hai biện pháp có thể được sử dụng khi xây dựng cây quyết định - những biện pháp này có thể hỗ trợ các lựa chọn của chúng tôi khi tách bộ vật phẩm.
1) 'Tạp chất Gini' - đó là một số liệu phân chia cây quyết định tiêu chuẩn (xem trong liên kết ở trên);
2) 'Hệ số Gini' - mỗi lần phân tách có thể được đánh giá dựa trên tiêu chí AUC. Đối với mỗi kịch bản phân tách, chúng ta có thể xây dựng một đường cong ROC và tính toán số liệu AUC. Theo Wikipedia AUC = (GiniCoeff + 1) / 2;
Câu hỏi là: cả hai biện pháp này có tương đương không? Một mặt, tôi được thông báo rằng không nên nhầm lẫn hệ số Gini với tạp chất Gini. Mặt khác, cả hai biện pháp này đều có thể được sử dụng để làm cùng một việc - đánh giá chất lượng của việc phân chia cây quyết định.