Câu hỏi được gắn thẻ «unbalanced-classes»

Dữ liệu được sắp xếp thành các danh mục riêng biệt hoặc * lớp * có thể đưa ra các vấn đề cho các phân tích nhất định nếu số lượng quan sát (n) thuộc về mỗi lớp không phải là hằng số giữa các lớp. Các lớp học không đồng đềun là * không cân bằng *.











4
Việc sử dụng đúng quy mô scale_pose_ weight trong xgboost cho các bộ dữ liệu không cân bằng là gì?
Tôi có một bộ dữ liệu rất mất cân bằng. Tôi đang cố gắng làm theo lời khuyên điều chỉnh và sử dụng scale_pos_weightnhưng không chắc tôi nên điều chỉnh nó như thế nào. Tôi có thể thấy điều RegLossObj.GetGradientđó: if (info.labels[i] == 1.0f) w *= param_.scale_pos_weight do đó, một …


2
Làm thế nào để xử lý sự khác biệt giữa phân phối của tập kiểm tra và tập huấn luyện?
Tôi nghĩ một giả định cơ bản của học máy hoặc ước lượng tham số là dữ liệu không nhìn thấy đến từ cùng một phân phối với tập huấn luyện. Tuy nhiên, trong một số trường hợp thực tế, việc phân phối bộ kiểm tra sẽ gần như khác …

3
Phân loại / số liệu đánh giá cho dữ liệu mất cân bằng cao
Tôi xử lý vấn đề phát hiện gian lận (giống như điểm tín dụng). Như vậy, có một mối quan hệ rất mất cân bằng giữa các quan sát gian lận và không gian lận. http://blog.revolutionanalytics.com/2016/03/com_group_eval_metrics_r.html cung cấp một cái nhìn tổng quan tuyệt vời về các số liệu phân …


Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.