Tạo một bộ dữ liệu không cân bằng


11

Tôi muốn thử nghiệm mô hình được đào tạo của tôi trên một bộ dữ liệu không cân bằng. Có bất kỳ thuật toán nào có sẵn để tạo dữ liệu tổng hợp từ bộ dữ liệu được gắn nhãn cân bằng (thư rác / không phải thư rác) không?


Bạn luôn có thể làm mất cân bằng bất kỳ dữ liệu nào được đặt bằng cách đơn giản nhấn mạnh một lớp.
dùng2974951

Câu trả lời:


8

Hãy thử SMOTE , một thuật toán được sử dụng để lấy mẫu quá mức. Nó tạo ra các mẫu tổng hợp từ lớp bạn muốn lấy mẫu quá mức.

Bạn có thể sử dụng điều này để tạo ra bất kỳ số lượng mẫu bạn cần.


1
SMote có thể được sử dụng để lấy mẫu không?
Stuart Peterson

Chà, bạn có thể lấy được lớp dưới lớp A bằng cách vượt quá lớp không ...
kjetil b halvorsen

3
@StuartPeterson Không, SMOTE là một thuật toán lấy mẫu quá mức, nhưng có nhiều thuật toán lấy mẫu khác
Mary93
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.