Xếp hạng tổng thể từ nhiều danh sách xếp hạng


13

Tôi đã xem qua rất nhiều tài liệu có sẵn trên mạng, bao gồm cả diễn đàn này mà không gặp may mắn và hy vọng ai đó có thể giúp đỡ một vấn đề thống kê mà tôi hiện đang phải đối mặt:

Tôi có 5 danh sách dữ liệu được xếp hạng, mỗi danh sách chứa 10 mục được xếp hạng từ vị trí 1 (tốt nhất) đến vị trí 10 (kém nhất). Vì lợi ích của bối cảnh, 10 mục trong mỗi danh sách là như nhau, nhưng trong các thứ tự xếp hạng khác nhau vì kỹ thuật được sử dụng để quyết định thứ hạng của chúng là khác nhau.

Dữ liệu ví dụ:

            List 1      List 2      List 3     ... etc
Item 1     Ranked 1    Ranked 2    Ranked 1     
Item 2     Ranked 3    Ranked 1    Ranked 2
Item 3     Ranked 2    Ranked 3    Ranked 3
... etc

Tôi đang tìm cách diễn giải và phân tích dữ liệu trên để tôi có được kết quả cuối cùng hiển thị thứ hạng tổng thể của từng mục dựa trên từng bài kiểm tra và vị trí của nó, ví dụ

Result
Rank 1 = Item 1
Rank 2 = Item 3
Rank 3 = Item 4
... etc

Cho đến nay tôi đã cố gắng diễn giải thông tin này từ việc thực hiện Pearson's Correlation, Spearman's Correlation, Kendall Tau's B và Friedman. Tuy nhiên, tôi đã phát hiện ra rằng các kết quả này thường đã ghép các danh sách của tôi (ví dụ: so sánh danh sách 1 với danh sách 2, sau đó liệt kê 1 đến danh sách 3, v.v.) hoặc đã tạo ra các kết quả như Chi-Square, P-Values, v.v. dữ liệu.

Có ai biết làm thế nào tôi có thể diễn giải dữ liệu này theo phương pháp thống kê (ở cấp độ sau đại học / tiến sĩ) để tôi có thể hiểu thứ hạng tổng thể báo hiệu tầm quan trọng của từng mục trong danh sách qua 5 bài kiểm tra không? Hoặc, nếu có một loại kỹ thuật hoặc kiểm tra thống kê khác mà tôi có thể xem xét, tôi sẽ đánh giá cao bất kỳ gợi ý hoặc hướng dẫn nào.

(Có lẽ cũng đáng chú ý, tôi cũng đã thực hiện các kỹ thuật toán học đơn giản hơn như tính tổng, tính trung bình, kiểm tra tối thiểu - tối đa, v.v., nhưng không cảm thấy những điều này đủ quan trọng về mặt thống kê ở cấp độ này).

Bất kỳ trợ giúp hoặc lời khuyên sẽ được đánh giá rất cao, cảm ơn bạn đã dành thời gian của bạn.


1
Tôi tìm thấy hai câu hỏi, được giải thích một cách thích hợp, dường như là trùng lặp (và do đó đã cung cấp câu trả lời): stats.stackexchange.com/search?q=valval+rank . Những điều này có đầy đủ không? Nếu không, hãy giúp chúng tôi hiểu điều gì là đặc biệt về tình huống của bạn.
whuber

Cám ơn phản hồi của bạn. Tôi đã xem qua những bài viết này, và tôi không chắc liệu chúng không phải là thứ tôi đang tìm kiếm hay liệu đó có phải là sự hiểu biết của tôi không. Tôi có ấn tượng trong các bài viết này rằng mỗi bộ dữ liệu có nhiều biến có ý nghĩa khác nhau và các cấp bậc có thể khác nhau hoặc có nhiều giá trị số nguyên chi tiết hơn chỉ là thứ hạng. Tôi chỉ tìm kiếm một cách đã được thống kê để có thể nói 'tổng thể mặt hàng quan trọng nhất là mặt hàng X, tiếp theo là Y ... và cuối cùng (hoặc ít quan trọng nhất) mặt hàng Z'. Tôi gần như đang xem xét phân tích các thứ hạng 1-10 này dưới dạng số đơn giản
Liam

1
Một điểm chính của những chủ đề đó là không tồn tại bất kỳ "cách chứng minh thống kê" nào như vậy. Đó là một câu hỏi về định giá : bất kỳ kết hợp thống kê nào về kết quả của bạn phản ánh ý thức đánh đổi giữa chúng. Ví dụ: "đối tượng" của bạn có thể là ô tô và "kỹ thuật" có thể xếp hạng chúng theo các thuộc tính khác nhau: chi phí, hiệu quả nhiên liệu, sức mạnh, sự thoải mái, v.v ... Ý thức cá nhân của bạn về "tốt nhất" có thể khác biệt đáng kể so với ý nghĩa của người khác và cả hai bạn sẽ đúng.
whuber

bạn đã có câu trả lời chưa? vui lòng để lại bình luận tại đây stats.stackexchange.com/questions/347336/ từ
Ray

Câu trả lời:


7

Tôi không chắc tại sao bạn lại nhìn vào mối tương quan và các biện pháp tương tự. Dường như không có gì để tương quan.

Thay vào đó, có một số tùy chọn, không có lựa chọn nào thực sự tốt hơn cái kia, nhưng tùy thuộc vào những gì bạn muốn:

Lấy thứ hạng trung bình và sau đó xếp hạng trung bình (nhưng điều này coi dữ liệu là khoảng thời gian)

Lấy thứ hạng trung vị và sau đó xếp hạng trung vị (nhưng điều này có thể dẫn đến mối quan hệ)

Lấy số phiếu bầu vị trí số 1 mà mỗi mục nhận được và xếp hạng chúng dựa trên điều này

Lấy số phiếu bầu vị trí cuối cùng và xếp hạng chúng (ngược lại, rõ ràng) dựa trên đó.

Tạo một số kết hợp trọng số của các cấp bậc, tùy thuộc vào những gì bạn nghĩ hợp lý.


4
Một điểm quan trọng được đưa ra trong các chủ đề mà tôi đã tham chiếu trong một nhận xét - và tôi nghĩ rằng đây là mấu chốt của toàn bộ vấn đề - là tất cả các phương pháp này là tùy ý . Có tồn tại các phương pháp khách quan nhưng chúng yêu cầu sử dụng thông tin không có trong dữ liệu. Đó là những gì làm cho vấn đề định giá hơn là thống kê.
whuber

Những gì kết hợp trọng số của cấp bậc bạn sẽ đề nghị?
Archie

4

Như những người khác đã chỉ ra, có rất nhiều lựa chọn bạn có thể theo đuổi. Phương pháp tôi đề xuất dựa trên thứ hạng trung bình, tức là đề xuất đầu tiên của Peter.

Trong trường hợp này, tầm quan trọng thống kê của xếp hạng cuối cùng có thể được kiểm tra bằng thử nghiệm thống kê hai bước. Đây là một thủ tục không tham số bao gồm xét nghiệm Friedman với xét nghiệm hậu hoc tương ứng, xét nghiệm Nemenyi . Cả hai đều dựa trên thứ hạng trung bình. Mục đích của việc kiểm tra Friedman là để bác bỏ giả thuyết và kết luận rằng có một số khác biệt giữa các mục. Nếu đúng như vậy, chúng tôi tiến hành thử nghiệm Nemenyi để tìm ra mặt hàng nào thực sự khác biệt. (Chúng tôi không trực tiếp bắt đầu với bài kiểm tra sau hoc để tránh tầm quan trọng được tìm thấy một cách tình cờ.)

Thông tin chi tiết, chẳng hạn như các giá trị quan trọng cho cả hai thử nghiệm này, có thể được tìm thấy trong bài báo của Demsar .


2

Sử dụng Tau-x (trong đó "x" dùng để chỉ "eXtends" Tau-b). Tau-x là tương quan tương đương với thước đo khoảng cách Kemeny-Snell - được chứng minh là thước đo khoảng cách duy nhất giữa các danh sách các mục được xếp hạng đáp ứng tất cả các yêu cầu của thước đo khoảng cách. Xem chương 2 của "Các mô hình toán học trong khoa học xã hội" của Kemeny và Snell, cũng "Hệ số tương quan xếp hạng mới với ứng dụng cho vấn đề xếp hạng đồng thuận, Edward Emond, David Mason, Tạp chí Phân tích quyết định đa tiêu chí, 11: 17- 28 (2002).

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.