Mục khác nhau dựa trên đề xuất và người dùng dựa trên Mahout


14

Tôi muốn biết chính xác đề xuất dựa trên người dùng và mục dựa trên người khác nhau như thế nào.

Nó định nghĩa rằng

Dựa trên người dùng : Đề xuất các mục bằng cách tìm người dùng tương tự. Điều này thường khó mở rộng hơn vì tính chất năng động của người dùng.

Dựa trên vật phẩm : Tính toán sự tương đồng giữa các vật phẩm và đưa ra khuyến nghị. Các mục thường không thay đổi nhiều, vì vậy điều này thường có thể được tính toán ngoài dòng.

Nhưng mặc dù có hai loại khuyến nghị có sẵn, nhưng điều tôi hiểu là cả hai loại này sẽ lấy một số mô hình dữ liệu (giả sử 1,2 hoặc 1,2, 0,5 như item1, item2, value hoặc user1, user2, value trong đó giá trị không bắt buộc) và sẽ thực hiện tất cả các phép tính như là thước đo tương tự và hàm tích hợp đề xuất mà chúng tôi đã chọn và chúng tôi có thể chạy cả đề xuất dựa trên người dùng / mục trên cùng một dữ liệu (đây có phải là giả định chính xác không ??).

Vì vậy, tôi muốn biết chính xác và trong tất cả các khía cạnh của hai loại thuật toán này khác nhau như thế nào.

Câu trả lời:


11

Bạn đúng rằng cả hai mô hình hoạt động trên cùng một dữ liệu mà không có vấn đề gì. Cả hai mục hoạt động trên một ma trận xếp hạng người dùng.

Theo cách tiếp cận dựa trên người dùng, thuật toán tạo ra xếp hạng cho một mục ibởi người dùng ubằng cách kết hợp xếp hạng của những người dùng khác u'tương tự u. Tương tự ở đây có nghĩa là xếp hạng của hai người dùng có tương quan Pearson cao hoặc độ tương tự cosine hoặc một cái gì đó tương tự.

Theo cách tiếp cận dựa trên vật phẩm, chúng tôi tạo ra xếp hạng ibằng ucách xem xét bộ vật phẩm i'tương tự i(theo nghĩa tương tự như trên trừ bây giờ chúng tôi sẽ xem xét xếp hạng mà vật phẩm đã nhận được từ người dùng) uđã xếp hạng và sau đó kết hợp các xếp hạng bởi ucác i'thành một đánh giá được dự đoán bởi ucho i.

Cách tiếp cận dựa trên vật phẩm được phát minh tại Amazon ( http://dl.acm.org/citation.cfm?id=642471 ) để giải quyết các thách thức quy mô của chúng với tính năng lọc dựa trên người dùng. Số lượng những thứ họ bán ít hơn và ít năng động hơn nhiều so với số lượng người dùng, do đó, sự tương đồng của mặt hàng có thể được tính ngoại tuyến và truy cập khi cần.


21

Thuật toán dựa trên vật phẩm

for every item i that u has no preference for yet

  for every item j that u has a preference for

    compute a similarity s between i and j

    add u's preference for j, weighted by s, to a running average

 return the top items, ranked by weighted average

Thuật toán dựa trên người dùng

for every item i that u has no preference for yet

 for every other user v that has a preference for i

   compute a similarity s between u and v

   add v's preference for i, weighted by s, to a running average

 return the top items, ranked by weighted average

Mục so với người dùng:

1) Đề xuất chia tỷ lệ với số lượng mặt hàng hoặc người dùng mà họ phải xử lý, do đó, có các kịch bản trong đó mỗi loại có thể hoạt động tốt hơn các loại khác

2) Ước tính tương đồng giữa các mục có nhiều khả năng hội tụ theo thời gian hơn so với sự tương đồng giữa những người dùng

3) Chúng tôi có thể tính toán và tương tự bộ đệm tương tự hội tụ, điều này có thể mang lại cho người giới thiệu dựa trên mục một lợi thế về hiệu suất

4) Người giới thiệu dựa trên vật phẩm bắt đầu bằng danh sách các mục ưa thích của người dùng và do đó không cần vùng lân cận mục gần nhất như người giới thiệu dựa trên người dùng làm


Cảnh báo công bằng: Liên kết không được chấp nhận là câu trả lời trên trang web này. Tôi khuyên bạn nên chỉnh sửa hoặc xóa trước khi bạn nhận được bất kỳ downvote nào!
sheldonkreger

1
rất có thể có một lỗi đánh máy trong "thuật toán dựa trên người dùng" - dòng thứ tư nên bắt đầu bằng "thêm ưu tiên của bạn cho tôi ..."
Bernardo Aflalo

@BernardoAflalo Tôi không nghĩ đó là một lỗi đánh máy, bạn thêm ưu tiên cho tất cả các v, và sau đó lấy trung bình có trọng số
Oswald
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.