Chuyển đổi danh sách xếp hạng một phần thành bảng xếp hạng toàn cầu

Tôi đang làm việc về một cái gì đó giống như vấn đề sau đây. Tôi có một loạt người dùng và N cuốn sách. Mỗi người dùng tạo một bảng xếp hạng theo thứ tự của tất cả những cuốn sách anh ta đọc (có thể là một tập hợp con của N sách), ví dụ: Sách 1> Sách 40> Sách 25.

Bây giờ tôi muốn biến những thứ hạng người dùng cá nhân này thành một thứ hạng duy nhất của tất cả các cuốn sách.

Có bất kỳ phương pháp tốt hoặc tiêu chuẩn để thử? Cho đến nay, tôi đang nghĩ về các mô hình Bradley-Terry được áp dụng để so sánh theo cặp, nhưng tôi tự hỏi liệu có gì khác không.

— raegtin
nguồn

Tôi sẽ nghĩ rằng bạn sẽ gặp rất nhiều vấn đề với sự thưa thớt, trừ khi người dùng (vì một số lý do) đọc những cuốn sách tương tự. Nhưng với n người, và được cho rằng hầu hết mọi người đọc tương đối ít sách, đại đa số các cặp sẽ chỉ có một người thực hiện so sánh. (Số trung vị là 6 mỗi người mỗi năm, xem Pew

— Peter Flom - Rebstate Monica

(+1) raegtin, bạn hỏi những câu hỏi hay, thú vị. Tôi thích các mô hình BT, nhưng có vẻ như một chút ép buộc ở đây. Bạn có quen thuộc với các tài liệu lọc cộng tác? Đó không phải là cùng một vấn đề, nhưng một số khái niệm và kỹ thuật có thể được mượn. Một câu hỏi chưa được giải quyết ở đây là tại sao người ta nên tin rằng các cuốn sách có thể được xếp hạng rõ ràng, được xác định rõ ràng ngay từ đầu. (Làm thế nào bạn sẽ xử lý trường hợp hai người dùng, hai cuốn sách, ví dụ?)

— hồng y

@Peter Flom: Đúng, hầu hết các cặp không có sự so sánh. Nhưng tôi hy vọng điều đó tốt, vì nếu bạn biết rằng A> B và B> C, thì ngay cả khi A và C không được so sánh trực tiếp, bạn có thể suy ra A> C.

— raegtin

@cardinal: Yep, các mô hình BT dường như bị ép buộc ở đây, nhưng đó là điều duy nhất tôi có thể nghĩ ra ngay bây giờ. Tôi quen thuộc với tài liệu lọc cộng tác, nhưng tôi không chắc nó áp dụng ở đây như thế nào, vì tôi muốn thứ hạng, không phải là điểm tương đồng. Đúng là một bảng xếp hạng toàn cầu không nhất thiết phải có ý nghĩa (ví dụ, có hợp lý không khi so sánh sách của trẻ em với sách người lớn? Tiểu thuyết so với phi hư cấu?), Nhưng thực tế, nó vẫn hữu ích. Danh sách sách "hay nhất" bật lên mọi lúc :)

— raegtin

Ngoài ra, tôi không quan tâm lắm đến các thứ tự gần (ví dụ: liệu cuốn sách được xếp hạng số 1 có thực sự tốt hơn cuốn sách số 2) hay không, nhưng thay vào đó là thứ tự tổng hợp (ví dụ: tôi muốn 10% số sách hàng đầu trong đơn hàng của tôi tốt hơn 10% dưới cùng hoặc 10% giữa).

— raegtin

Câu trả lời:

Nếu bạn đang quan tâm đến việc sử dụng (hơn trong việc phát triển), bạn nên cung cấp cho một cố gắng để rankade , hệ thống xếp hạng của chúng tôi.

Xếp hạng là miễn phí và dễ sử dụng, và nó khác với mô hình Bradley-Terry và hệ thống xếp hạng Elo (đây là so sánh ) vì nó có thể quản lý các trận đấu với hơn 2 phe (ví dụ như sách, trong kịch bản của bạn). Chèn thứ hạng theo thứ tự của người dùng (như các trận đấu giữa hai hoặc nhiều cuốn sách, với bảng xếp hạng chi tiết cuối cùng, bao gồm cả các mối quan hệ) bạn sẽ có được thứ hạng duy nhất theo thứ tự của tất cả các cuốn sách bạn đang tìm kiếm. Trong nghiện, xếp hạng cung cấp cho bạn cơ hội để kiểm tra sự tiến hóa thời gian để xếp hạng sách và số liệu thống kê cho các trận đấu sách, v.v.

— Tomaso Neri
nguồn

Bạn nên mô tả thuật toán của bạn, ít nhất là nói chung, như cách tiếp cận. Và liên kết đến một bài báo nơi nó được mô tả đầy đủ. Nếu không, câu trả lời của bạn có thể được coi là chỉ đơn giản là một quảng cáo.

— ttnphns

Tôi đã thêm một liên kết để so sánh đơn giản giữa ree và hệ thống xếp hạng được biết đến nhiều nhất. Tuyên bố đầu tiên cho biết Nếu bạn quan tâm đến việc sử dụng (hơn là trong phát triển) , do đó, nó được đề xuất như là một giải pháp cho vấn đề (xếp hạng có tính năng GUI, trong khi Bradley-Terry và Plackett-Luce cần sử dụng), hơn là một đường dẫn để đạt được giải pháp yêu cầu.

— Tomaso Neri

Các mô hình xếp hạng Plackett-Luce giải quyết vấn đề này và là một kỹ thuật dựa trên khả năng trong đó khả năng được tối đa hóa bằng cách sử dụng thói quen tối đa hóa chính, tương tự như Tối đa hóa kỳ vọng, theo nghĩa là chúng sử dụng hàm mục tiêu phụ trên hàm khả năng được tối ưu hóa để đảm bảo tối đa hóa đơn điệu lặp của hàm khả năng. (xem thuật toán MM cho các mô hình xếp hạng Plackett-Luce của David Hunter). Ông cung cấp mã là tốt.

$>=$

Điều này phù hợp với dữ liệu của bạn một cách hoàn hảo:

Cuốn 1> quyển 40> quyển 25

Sách 40> Sách 30

Quyển 25> Quyển 17> Quyển 11> Quyển 3 v.v.

— xe tang
nguồn