Lĩnh vực máy Aware Factorization


Câu trả lời:


2

Có vẻ như bạn đang yêu cầu một mô tả cấp cao. Nếu bạn tham khảo các slide được liên kết đến trong các slide của bài viết gốc của bạn, thì có sự so sánh giữa FM (slide 11) so với FFM (slide 12).

Ví dụ nhanh, nếu bạn đang tìm hiểu về người dùng và phim, FM có thể có các yếu tố sau:

w_{user_1}*w_{movie_1}*... + w{user_1}*w_{genre_1}*...

FFM sẽ có:

w_{user_1, movies}*w_{movie_1, users}*... + w{user_1, genres}*w_{genre_1, users}*...

Sự khác biệt chính là trong FM, w_{user_1}hệ số này giống nhau ở cả hai thuật ngữ - có một khái niệm duy nhất về người dùng. Trong FFM, bạn tìm hiểu riêng w_{user_1}cho từng bối cảnh, ví dụ: liệu nó có tương tác với phim hay thể loại hay không. Lưu ý rằng nó không được học riêng cho từng bộ phim hoặc thể loại cụ thể, nhưng đối với phim và thể loại nói chung. Đó là, nó học riêng bối cảnh của người dùng cho từng loại tương tác.

Cũng lưu ý rằng w_{movie_1}đã đi đến w_{movie_1, users}vì thuật ngữ đó đang tương tác với w_{user_1}, một người dùng.


2

Giả sử (trước khi mã hóa một lần nóng), bạn có các yếu tố dự đoán / trường từ một bộ (giả sử thể loại phim, giới tính người dùng và chủng tộc người dùng). Giả sử xa hơn, mỗi bộ dự đoán có thể nhận một trong các giá trị . Sau khi mã hóa một lần nóng, bạn sẽ có một bộ tính năng nhị phân có kích thước .ZzZkzXK:=zZkz

Trong một mô hình có tất cả các tương tác, bạn phải ước tính một ma trận các hệ số tương tác , có thuật ngữ duy nhất.QK×(K+1)/2

Máy nhân tố đặt cấu trúc lên ma trận và giả sử rằng , trong đó có kích thước , với một số số do người dùng chỉ định. Chúng tôi ước tính thay vì .QQWTWWl×K1lKWQ

Trường-aware puts máy thừa số cấu trúc trên là tốt. Nó phân vùng thành các khối dựa trên (các tính năng ban đầu). Nếu biểu thị khối của , chúng tôi giả sử rằng xuất phát từ khối của , trong đó có kích thước . Như với FM, chúng tôi ước tính thay vì .Q z q z i , z j z i , z j Q q z i , z j z i , z j W T j W i W i l × K W i QQQzqzi,zjzi,zjQqzi,zjzi,zjWjTWiWil×KWiQ

Hệ số FM của có tham số . FM "nhận biết yếu" cóthông số. Một mô hình với tất cả các tương tác có tham số . K × l K × l × | Z | K × ( K + 1 ) / 2QK×lK×l×|Z|K×(K+1)/2


1

Máy nhân tố tiêu chuẩn có các lĩnh vực quá. "Tính mới" ở đây dường như là việc sử dụng các tính năng GBDT và áp dụng các thủ thuật băm. Không có hiệu quả lớn, có vẻ như: kiểm tra phạm vi phút trong hiệu suất trên slide cuối cùng.


Theo các tác giả, thực sự có một đặc điểm nhận biết trường cho mô hình, liên quan đến việc thực hiện tiêu chuẩn - nó được nêu trong các diễn đàn kaggle. Tôi chỉ không thể làm theo ý nghĩa của nó và sự khác biệt thực sự là gì.
B_Miner


Dựa trên slie 14, có vẻ như họ dựa trên giải pháp của họ trên bài báo này (Bộ sưu tập các mô hình được thiết kế hợp tác và tính năng hợp tác để dự đoán tỷ lệ nhấp ).
Emre
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.