Tôi đang tìm hiểu sâu hơn về lọc cộng tác. Một bài viết thực sự thú vị là "Một nghiên cứu so sánh các thuật toán lọc cộng tác" http://arxiv.org/pdf/1205.3193.pdf
Để chọn thuật toán CF nào sẽ được sử dụng, bài viết đề cập đến mật độ của tập dữ liệu. Những gì nó không làm là giải thích cách bạn thực sự tính mật độ của tập dữ liệu của bạn.
Vì vậy, trong bối cảnh của bài báo trên, bất cứ ai có thể giúp tôi giải thích cho tôi cách tính mật độ của một tập dữ liệu? Bài viết đề cập đến mật độ thường xuyên trong phạm vi 1-5%.