Làm cách nào để tạo hệ thống đề xuất tích hợp cả tính năng lọc cộng tác và nội dung?


10

Tôi đang tạo một Hệ thống giới thiệu và muốn kết hợp cả xếp hạng của người dùng "tương tự" và các tính năng của các mục. Đầu ra là một đánh giá dự đoán [0-1]. Tôi đang xem xét Mạng thần kinh (để bắt đầu).

Vì vậy, các đầu vào là sự kết hợp các tính năng của các mặt hàng và xếp hạng của từng người dùng. Đối với mục A và người dùng 1, hệ thống có thể được đào tạo về dữ liệu kết hợp, A1. Đây sẽ là một ví dụ đào tạo.

Nếu người dùng 1 cũng đánh giá phim B thì sao? Sau đó, dữ liệu B1 cũng sẽ là một ví dụ đào tạo? Có vấn đề gì với việc lặp lại việc đào tạo với các tính năng của người dùng 1 theo cách này không?

Bạn có bất cứ đề nghị về một cách tốt hơn để tiếp cận vấn đề?

Câu trả lời:


11

Tại sao bạn đang xem xét một mạng lưới thần kinh trước khi hoàn toàn hiểu vấn đề?

Các phương pháp nhân tố ma trận tiêu chuẩn để lọc cộng tác có thể tận dụng các tính năng nội dung một cách dễ dàng. Để biết ví dụ về cách thực hiện việc này trong cài đặt Bayes, hãy xem giấy Matchbox .


6

Ba bài viết về tích hợp nhân tố ma trận với các tính năng nội dung (ở đây, mô hình chủ đề cụ thể):

  • Deepak Agarwal và Bee-Chung Chen. 2010. fLDA: nhân tố ma trận thông qua phân bổ dirichlet tiềm ẩn. Trong Kỷ yếu của hội nghị quốc tế ACM lần thứ ba về tìm kiếm và khai thác dữ liệu trên web (WSDM '10). ACM, New York, NY, Hoa Kỳ, 91-100.
  • Hanhuai Shan và Arindam Banerjee. Năm 2010 Các yếu tố ma trận xác suất tổng quát cho lọc cộng tác. Trong Kỷ yếu của Hội nghị quốc tế về khai thác dữ liệu năm 2010 (ICDM '10). Xã hội máy tính IEEE, Washington, DC, Hoa Kỳ, 1025-1030.
  • Chong Wang và David M. Blei. 2011. Mô hình chủ đề hợp tác để giới thiệu các bài báo khoa học. Trong Kỷ yếu của hội nghị quốc tế ACM SIGKDD lần thứ 17 về khám phá tri thức và khai thác dữ liệu (KDD '11). ACM, New York, NY, Hoa Kỳ, 448-456.

Tôi cũng sẽ quảng bá mục blog riêng của mình để thảo luận về vấn đề này một chút: Mô hình chủ đề đáp ứng Mô hình nhân tố Lantent


3

Không cần một cách tiếp cận mạng thần kinh, lọc cộng tác là một thuật toán trên chính nó. Đối với vấn đề của bạn cụ thể, có một mô tả tốt về hệ thống cf và giới thiệu trên:

ml- class.org

(tìm XVI: recommender Systems). Đó là thanh lịch, đơn giản, và nếu bạn làm đúng (nghĩa là sử dụng hình thức véc tơ, tối thiểu hóa nhanh và độ dốc chuẩn bị), nó có thể khá nhanh.


Tôi đã sử dụng phương pháp đó, nhưng nó không sử dụng các tính năng của các mặt hàng. Tôi muốn bao gồm các tính năng là tốt.
B Bảy
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.