Hệ thống đề xuất năng động


14

Một hệ thống Recommender sẽ đo sự tương quan giữa xếp hạng của người dùng khác nhau và khuyến nghị năng suất cho một người dùng nào đó về các mục mà có thể quan tâm đến anh ấy.

Tuy nhiên, thị hiếu thay đổi theo thời gian nên xếp hạng cũ có thể không phản ánh sở thích hiện tại và ngược lại. Có thể bạn đã từng đặt "xuất sắc" vào một cuốn sách mà bây giờ bạn sẽ đánh giá là "không quá kinh tởm", v.v. Hơn nữa, lợi ích bản thân cũng thay đổi.

Làm thế nào hệ thống đề xuất nên làm việc trong một môi trường thay đổi?

  1. Một lựa chọn là cắt bỏ xếp hạng "cũ", có thể hoạt động tốt nếu giả sử bạn xác định chính xác "cũ" (thậm chí bạn có thể nói xếp hạng không bao giờ hết hạn và giả vờ rằng vấn đề không tồn tại). Nhưng đó không phải là lựa chọn tốt nhất có thể: tất nhiên thị hiếu phát triển, đó là một dòng chảy cuộc sống bình thường và không có lý do gì chúng ta không thể sử dụng kiến ​​thức bổ sung về một lần xếp hạng chính xác trong quá khứ.
  2. Một lựa chọn khác là bằng cách nào đó chứa đựng kiến ​​thức bổ sung này. Do đó, chúng tôi không thể tìm thấy "kết hợp tức thì" cho sở thích hiện tại của bạn mà đề xuất cho bạn những điều bạn có thể thích tiếp theo (trái ngược với những điều bạn có thể thích bây giờ ).

Tôi không chắc là tôi có giải thích điều này đủ tốt không. Về cơ bản, tôi ủng hộ cách tiếp cận thứ hai và đang nói về Hệ thống giới thiệu sẽ đo lường mối tương quan của các quỹ đạo vị giác và các khuyến nghị về năng suất sẽ phục vụ cho .. tốt, hãy gọi đó là sự tăng trưởng cá nhân - bởi vì chúng sẽ đến từ những người có "quỹ đạo thị hiếu" (và không chỉ là "ảnh chụp nhanh") tương tự như của bạn.

Bây giờ câu hỏi: Tôi tự hỏi nếu một cái gì đó tương tự như "tùy chọn 2" đã tồn tại và, nếu nó, tôi tự hỏi làm thế nào nó hoạt động. Và nếu nó không tồn tại, bạn có thể thảo luận về cách thức hoạt động của nó! :)

Câu trả lời:


8

Tôi thực sự khuyên bạn nên lọc Cộng tác bằng giấy với tính năng động tạm thời của Yehuda Koren (Cuộc thi Netflix!) Trong đó vấn đề này được thảo luận chi tiết.

Tôi đồng ý với tác giả, rằng lựa chọn đầu tiên ("cắt đứt") không phải là cách để đi. Đúng là các tùy chọn lỗi thời bị bỏ qua theo cách đó, nhưng a) một số tùy chọn không bao giờ thay đổi, do đó người ta sẽ giết dữ liệu để xác định các trường hợp thường xuyên và b) một số tùy chọn trong quá khứ được yêu cầu để hiểu các tùy chọn trong tương lai ( ví dụ: mua phần 1 -> bạn có khả năng mua phần 2).

Tuy nhiên, Koren không cố gắng xác định rõ ràng những quỹ đạo như vậy (tức là để người ta có thể dự đoán hành vi thay đổi trong tương lai của người dùng), vì đây là một nhiệm vụ rất khó khăn. Bạn có thể tưởng tượng điều này bằng cách ghi nhớ rằng, các "trạm" ưu tiên theo quỹ đạo KHÔNG bị ràng buộc với thời gian, nhưng với sự phát triển cá nhân của người dùng, có thể bị gián đoạn hoặc vượt qua bởi các quỹ đạo khác hoặc được thể hiện đơn giản theo một cách khác. Ví dụ, nếu một người chuyển từ phim hành động cứng sang phim hành động, thì không có thứ gọi là "phim hành động mềm nhập cảnh" nhất định hay đại loại như thế. Người dùng có thể vào khu vực này tại bất kỳ điểm nào (theo không gian thời gian và vật phẩm). Vấn đề này kết hợp với sự thưa thớt của dữ liệu khiến cho việc tạo ra một mô hình khả thi ở đây gần như không thể.

Thay vào đó, Koren cố gắng tách dữ liệu quá khứ thành tín hiệu mẫu dài hạn và nhiễu hàng ngày để tăng hiệu quả của các dự đoán xếp hạng. Ông áp dụng phương pháp này cho cả SVD và một mô hình neigborbood hợp tác đơn giản. Thật không may, tôi chưa hoàn thành với toán học, vì vậy tôi không thể cung cấp thêm chi tiết về điều này.

Lưu ý thêm về mô hình rõ ràng của các quỹ đạo

Khu vực của Sequence Mining cung cấp các phương thức để thực hiện, nhưng điểm quan trọng là tìm một đại diện trừu tượng phù hợp cho các mục (vì việc sử dụng chính các mục đó sẽ không hoạt động do độ thưa thớt), ví dụ như phân cụm thành các thẻ. Tuy nhiên, trong khi phương pháp này có thể cung cấp một số hiểu biết về hành vi của một số người dùng (Khai thác dữ liệu!) Thì có thể không liên quan đến ứng dụng cho tất cả khách hàng (ví dụ như đại chúng), do đó mô hình ngầm như đề xuất của Koren có thể tốt hơn cuối cùng.


Giấy Yehuda rất gần với những gì tôi đang nói, mặc dù thực sự anh ấy không nói về "quỹ đạo vị giác". Có lẽ bạn đã đúng và "tỷ lệ thay đổi khẩu vị" không cố định cho bất kỳ người nào .. Cảm ơn vì liên kết!
andreister

Vâng, đây là điều đầu tiên tôi nghĩ đến.
Stumpy Joe Pete

2

Tôi không biết về một hệ thống làm việc, nhưng sẽ không ngạc nhiên nếu Amazon, NetFlix hoặc ai đó có một hệ thống như vậy. Ngay cả công cụ tìm kiếm Google cũng có thể có một loại hệ thống tương tự.

Tôi đã nghĩ về điều này trong khi tham gia khóa học của Tiến sĩ Ng vào học kỳ trước. Cách tiếp cận đầu tiên tôi nghĩ sẽ là tối ưu sẽ là thêm một yếu tố trọng số dựa trên tuổi. Một phần dữ liệu hiện tại càng nhiều thì nó sẽ càng nặng nề. Cách tiếp cận này sẽ tương đối đơn giản và không tốn kém về mặt tính toán để thực hiện.

Tuy nhiên, sau khi suy nghĩ về cách tiếp cận này cẩn thận hơn, tôi nghĩ rằng nó có những sai sót nghiêm trọng đối với nhiều ứng dụng. Cá nhân, tôi sẽ thường theo một thể loại hoặc thể hiện trong một thời gian, mệt mỏi với nó, chuyển sang một thứ khác, nhưng trở lại thể loại ban đầu sau đó. Sự kiệt sức, chu kỳ nhen nhóm này cũng xuất hiện trong xã hội.

Do đó, tôi đang nghiêng về một hệ thống phức tạp hơn một chút. Dữ liệu sẽ cần được chia thành hai bộ; dữ liệu hiện tại - ngưỡng sẽ cần thay đổi tùy thuộc vào ứng dụng cộng với độ dài của các tương tác của từng cá nhân - sẽ có trọng số nặng hơn và dữ liệu "lịch sử" sẽ được đánh giá thấp hơn với giá trị giảm chậm theo thời gian. Thứ hai, một yếu tố sẽ được đưa vào để cố gắng phát hiện "tắt" khi mối quan tâm hoặc sự liên quan nặng nề đột nhiên biến mất. Dữ liệu "hiện tại" được phân loại tương tự sẽ được phân loại lại như thể nó là lịch sử.

Không có cách tiếp cận nào có bất kỳ sự nghiêm ngặt hay xác nhận nào, nhưng tôi tin rằng nó sẽ có giá trị khi xây dựng một số thử nghiệm của giả thuyết.


Ý tưởng của bạn về trọng lượng thấp hơn cho dữ liệu cũ tương tự như "tùy chọn 1" trên thực tế. Thay vào đó, tôi đang nói rằng toàn bộ quỹ đạo của việc thay đổi khẩu vị rất quan trọng - tức là, nếu ngày hôm qua bạn thích thể loại A và hôm nay bạn thích thể loại B, hệ thống sẽ nhìn vào những người khác có cùng "AB- ??" nếm di chuyển và sẽ gợi ý rằng ngày mai bạn sẽ thích thể loại C.
andreister

1

Như tôi thấy, một phiên bản sửa đổi của bộ lọc cộng tác có thể hoạt động. Tuy nhiên, bạn sẽ cần giữ dấu thời gian trên mỗi bảng xếp hạng và đưa ra hình phạt trong khi tính trọng số của thứ hạng cũ hơn.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.