Một hệ thống khuyến nghị giữ một bản ghi về những khuyến nghị đã được thực hiện cho một người dùng cụ thể và liệu người dùng đó có chấp nhận đề xuất đó không. Nó giống như
user_id item_id result
1 4 1
1 7 -1
5 19 1
5 80 1
trong đó 1 có nghĩa là người dùng chấp nhận đề xuất trong khi -1 có nghĩa là người dùng không phản hồi đề xuất.
Câu hỏi: Nếu tôi sẽ đưa ra đề xuất cho một nhóm người dùng dựa trên loại nhật ký được mô tả ở trên và tôi muốn tối đa hóa điểm số MAP @ 3, tôi nên xử lý dữ liệu ẩn (1 hoặc -1) như thế nào?
Ý tưởng của tôi là coi 1 và -1 là xếp hạng và dự đoán xếp hạng bằng thuật toán loại máy nhân tố. Nhưng điều này có vẻ không đúng, do tính không đối xứng của dữ liệu ngầm (-1 không có nghĩa là người dùng không thích đề xuất).
Chỉnh sửa 1 Chúng ta hãy suy nghĩ về nó trong bối cảnh của cách tiếp cận nhân tố ma trận. Nếu chúng ta coi -1 và 1 là xếp hạng, sẽ có một số vấn đề. Ví dụ: người dùng 1 thích phim A đạt điểm cao ở một yếu tố (ví dụ: có nhạc nền vinh quang) trong không gian yếu tố tiềm ẩn. Hệ thống khuyến nghị phim B cũng đạt điểm cao trong "nhạc nền vinh quang", nhưng vì một số lý do, người dùng 1 quá bận rộn để xem xét đề xuất và chúng tôi có phim xếp hạng -1 B. Nếu chúng tôi chỉ coi 1 hoặc -1 bằng nhau , sau đó hệ thống có thể không khuyến khích giới thiệu phim có BGM vinh quang cho người dùng 1 trong khi người dùng 1 vẫn thích phim có BGM vinh quang. Tôi nghĩ rằng tình huống này là để tránh.