Làm thế nào để tôi đặt hàng hoặc xếp hạng một bộ các chuyên gia?


11

Tôi có một cơ sở dữ liệu chứa một số lượng lớn các chuyên gia trong một lĩnh vực. Đối với mỗi chuyên gia đó, tôi có nhiều điểm thuộc tính / điểm dữ liệu như:

  • số năm kinh nghiệm.
  • giấy phép
  • số đánh giá
  • nội dung văn bản của những đánh giá
  • Xếp hạng 5 sao cho mỗi đánh giá đó, cho một số yếu tố như tốc độ, chất lượng, v.v.
  • giải thưởng, assosciations, hội nghị, vv

Tôi muốn cung cấp một đánh giá cho các chuyên gia nói trong số 10 dựa trên tầm quan trọng của họ. Một số điểm dữ liệu có thể bị thiếu đối với một số chuyên gia. Bây giờ câu hỏi của tôi là làm thế nào để tôi đưa ra một thuật toán như vậy? Bất cứ ai có thể chỉ cho tôi một số tài liệu có liên quan?

Ngoài ra tôi lo ngại rằng như với tất cả các đánh giá / đánh giá, các con số có thể tập hợp gần một số giá trị. Ví dụ, hầu hết trong số họ cuối cùng có thể nhận được 8 hoặc 5. Có cách nào để làm nổi bật sự khác biệt của litle thành sự khác biệt lớn hơn về điểm số đối với chỉ một số thuộc tính.

Một số cuộc thảo luận khác mà tôi cho rằng có thể có liên quan:


Nó không thể được thực hiện trừ khi bạn đi đến một số tiêu chí khách quan; có lẽ hầu hết các xếp hạng có thể có thể được xây dựng với một số kết hợp các tham số của bạn.

Câu trả lời:


12

Mọi người đã phát minh ra nhiều hệ thống để đánh giá mọi thứ (như chuyên gia) trên nhiều tiêu chí: truy cập trang Wikipedia về phân tích quyết định Đa tiêu chí để biết danh sách. Tuy nhiên, không được đại diện tốt ở đây là một trong những phương pháp phòng thủ nhất hiện có: Lý thuyết định giá đa thuộc tính. Điều này bao gồm một tập hợp các phương pháp để đánh giá sự đánh đổi giữa các bộ tiêu chí để (a) xác định một cách thích hợp để thể hiện lại các giá trị của các biến riêng lẻ và (b) cân nhắc các giá trị được biểu thị lại để đạt được điểm xếp hạng . Các nguyên tắc rất đơn giản và có thể phòng thủ, toán học là không thể tin được, và không có gì lạ mắt về lý thuyết. Nhiều người nên biết và thực hành các phương pháp này hơn là phát minh ra các hệ thống tính điểm tùy ý.


Bạn có biết gói R để làm việc này không?
dùng333

3
@user Không, và tôi nghi ngờ có một. Nhân tiện, không có viên đạn phần mềm ma ​​thuật nào: hầu như tất cả các công việc đều liên quan đến việc suy nghĩ thông qua các vấn đề và khám phá sự đánh đổi cụ thể theo cách thức được kiểm soát.
whuber

3

Cuối cùng, điều này có thể không chỉ là một bài tập thống kê. PCA là một phương pháp định lượng rất mạnh mẽ sẽ cho phép bạn tạo điểm hoặc trọng số trên một vài thành phần chính đầu tiên mà bạn có thể sử dụng để xếp hạng. Tuy nhiên, việc giải thích những gì các thành phần chính là rất khó khăn. Chúng là các cấu trúc định lượng. Họ không phải là người biện chứng. Vì vậy, để giải thích những gì họ thực sự có nghĩa là đôi khi không thể. Điều này đặc biệt đúng nếu bạn có một đối tượng không định lượng. Họ sẽ không biết bạn đang nói về cái gì Và, sẽ nghĩ về PCA của bạn như một hộp đen khó hiểu.

Thay vào đó, tôi chỉ đơn giản là sắp xếp tất cả các biến có liên quan và sử dụng một hệ thống trọng số dựa trên những gì người ta nghĩ rằng trọng số phải là.

Tôi nghĩ rằng nếu bạn phát triển điều này cho người ngoài, khách hàng, người dùng, sẽ thật tuyệt nếu bạn có thể linh hoạt trong việc quyết định trọng số cho người dùng.
Một số người dùng có thể đánh giá nhiều năm kinh nghiệm hơn nhiều so với chứng nhận và ngược lại. Nếu bạn có thể để lại quyết định đó cho họ. Bằng cách này, thuật toán của bạn không phải là hộp đen mà họ không hiểu và họ không thoải mái. Bạn giữ nó hoàn toàn minh bạch và tùy thuộc vào họ dựa trên đánh giá tương đối của chính họ về những gì quan trọng.


@Gaetan Chà, đối với PCA, bạn phải tìm một mã số phù hợp cho biến, chẳng hạn như "nội dung văn bản" ...
chl

Đó không phải là vấn đề tôi đang nêu ra. PCA có thể xử lý các biến giả như bạn đề xuất. PCA là vô cùng mạnh mẽ và linh hoạt theo cách đó. Nhưng, chính việc giải thích các thành phần chính trở nên thực sự thách thức. Giả sử thành phần chính đầu tiên bắt đầu như thế này: 0,02 năm kinh nghiệm - 0,4 nội dung văn bản của các đánh giá + 0,01 liên kết ... Có lẽ bạn có thể giải thích nó. Một hiệu suất chuyên gia tỷ lệ thuận với nhiều năm kinh nghiệm, nhưng tỷ lệ nghịch với nội dung văn bản của các đánh giá? Có vẻ vô lý. Nhưng, PCA thường không tạo ra kết quả phản trực quan.
Sympa

@Gaetan Tuy nhiên, tôi nhắc lại ý kiến ​​của mình rằng vấn đề nằm ở cách bạn chọn đại diện cho các biến của mình (hoặc cách bạn tìm thấy một số liệu hữu ích). Tôi đồng ý với bạn về khó khăn trong việc diễn giải sự kết hợp tuyến tính của các biến khi xử lý các phép đo không liên tục hoặc kết hợp các loại dữ liệu. Đây là lý do tại sao tôi đề nghị trong một bình luận khác để tìm kiếm các phương pháp giai thừa. Dù sao, việc phát triển các quy tắc tính điểm dựa trên sở thích của người dùng hoặc đánh giá của chuyên gia (như được thực hiện trong đánh giá lâm sàng) cũng yêu cầu một số loại xác nhận thống kê (ít nhất là để đảm bảo độ tin cậy của điểm số).
chl

@Gaetan, Có một số ý kiến ​​của bạn rất có ý nghĩa và bạn nói đúng rằng đó không chỉ là một bài tập thống kê mà còn liên quan đến các yếu tố mang tính chủ quan hơn. Lý do là ý định từ quan điểm người dùng / khách hàng có thể khác nhau. Giả sử anh ta đang tìm kiếm một chuyên gia, sau đó tôi chỉ cần thêm các bộ lọc để cho phép anh ta chọn chuyên gia> X số năm kinh nghiệm, v.v. Nhưng giả sử anh ta thu hẹp xuống còn 2 chuyên gia và muốn so sánh độc lập. Vì vậy, tôi chỉ tìm kiếm một phương pháp chung để so sánh bất kỳ hai chuyên gia.
Sidmitra

2
+1 để chỉ ra đây không phải là một bài tập thống kê. Tốt nhất, PCA có thể mô tả các mối quan hệ trong một tập dữ liệu cụ thể và, có thể hiểu được, đơn giản hóa dữ liệu bằng cách xác định các cộng đồng gần. Không rõ làm thế nào nó có thể thông báo cho chúng tôi về cách xếp hạng các chuyên gia.
whuber

0

Bạn có nghĩ rằng bạn có thể định lượng tất cả các thuộc tính đó?

Nếu có, tôi sẽ đề nghị thực hiện phân tích thành phần chính. Trong trường hợp chung khi tất cả các mối tương quan là dương (và nếu chúng không có, bạn có thể dễ dàng đến đó bằng cách sử dụng một số biến đổi), thành phần chính đầu tiên có thể được coi là thước đo tầm quan trọng của chuyên gia, vì nó là trọng số trung bình của tất cả các thuộc tính (và các trọng số sẽ là đóng góp tương ứng của các biến - Theo quan điểm này, chính phương thức sẽ tiết lộ tầm quan trọng của từng thuộc tính). Điểm số mà mỗi chuyên gia đạt được trong thành phần chính đầu tiên là những gì bạn cần để xếp hạng chúng.


1
Điều này có vẻ tốt, nhưng nó sẽ không chọn các thuộc tính có phương sai cao nhất và các cụm lớn nhất của các tương quan chéo?

1
Ngoài ra, người ta có thể thực hiện nhiều phân tích tương ứng hoặc phân tích nhiều yếu tố cho dữ liệu hỗn hợp (nếu mã hóa số xảy ra không thực tế đối với một số biến) và phần còn lại của ý tưởng của bạn (điểm yếu tố điện toán và xem xét tải trọng biến đổi ở chiều thứ 1) cũng.
chl

3
Dường như với tôi, thành phần đầu tiên sẽ chỉ chỉ ra một hướng đi chung mạnh mẽ giữa các chuyên gia. Làm thế nào nó có thể cho chúng ta biết ai tốt hơn và ai xấu hơn? Điều đó đòi hỏi thông tin bổ sung liên quan đến mối quan hệ giữa các biến này và chất lượng trở thành một chuyên gia "tốt" hoặc "xấu". Nếu chúng tôi tin rằng tất cả các biến đều liên quan đơn điệu với tốt hay xấu, thì có lẽ PCA có thể giúp chúng tôi khám phá biên giới của các chuyên gia cực đoan (hoặc có thể chỉ là ngoại lệ!). Xem ra mặc dù - ngay cả giả định đơn điệu là nghi ngờ.
whuber

1
@whuber Tôi thấy điểm, cảm ơn. Có lẽ bạn có thể thêm điều này trong phản ứng của riêng bạn (rất được hoan nghênh)?
chl
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.