Có thể việc thêm dữ liệu được tạo vào bộ dữ liệu của bạn sẽ làm giảm tỷ lệ gian lận / không gian lận và làm cho tập dữ liệu của bạn trở nên đại diện / có thể sử dụng hơn?
Tại GenieLog, chúng tôi đang sản xuất dữ liệu thử nghiệm để thiết kế và thử nghiệm các công cụ phát hiện gian lận. Chúng tôi tạo GEDIS Studio, chúng tôi có thể xác định hồ sơ thường xuyên và hồ sơ lừa đảo, khởi tạo từng danh mục theo tỷ lệ tùy chỉnh (ví dụ: 2% khách hàng sẽ sử dụng gian lận các sự kiện được tạo.)
Chúng tôi đã thực hiện thành công cho CDR viễn thông ( http://www.gedis-studio.com/online-call-detail-records-cdr-generator.html ) và cách sử dụng Thẻ tín dụng. Có quyền truy cập miễn phí vào trình tạo trực tuyến trên http://www.data-generator.com
Tôi khá chắc chắn rằng ngay cả khi công cụ không phù hợp với nhu cầu của bạn thì ít nhất phương pháp này có thể có giá trị. Nếu không, tôi sẽ quan tâm để đọc bất kỳ phản đối :)
Trân trọng