Làm thế nào để đo lường mức độ hoàn hảo của những người đóng góp của cộng đồng SE?


12

Stack Exchange, như tất cả chúng ta đều biết, là một tập hợp các trang web hỏi đáp với các chủ đề đa dạng. Giả sử rằng mỗi trang web độc lập với nhau, dựa trên số liệu thống kê mà người dùng có, làm thế nào để tính toán "tính tròn trịa" của anh ta so với anh chàng tiếp theo? Công cụ thống kê tôi nên sử dụng là gì?

Thành thật mà nói, tôi không biết cách xác định một cách toán học "tính tròn trịa", nhưng nó phải có các đặc điểm sau:

  1. Tất cả mọi thứ đều bình đẳng, người dùng càng có nhiều đại diện, anh ta càng tròn trịa
  2. Tất cả mọi thứ đều bình đẳng, càng nhiều người dùng tham gia vào trang web, anh ta càng được làm tròn.
  3. Cho dù câu trả lời hoặc câu hỏi không ảnh hưởng đến độ tròn

Làm thế nào bạn sẽ xác định "tròn trịa" trong bối cảnh SE, trước hết?
JM không phải là một thống kê

@JM, tôi không biết, đó là lý do tại sao tôi hy vọng rằng cộng đồng sẽ giúp đưa ra các khái niệm thêm một chút nữa.
Graviton

1
Có nguy cơ nghe giống như một trong những cảnh sát PC bị đau đầu gối - Hãy bao gồm những người phụ nữ truy cập trang web của chúng tôi. @Graviton, Tất cả các tài liệu tham khảo của bạn là dành cho nam giới.
rolando2

Độ tròn được xác định bởi ID người dùng không cho bạn biết về độ tròn của người đóng góp , vì người đóng góp có thể có ID người dùng khác nhau cho các SE khác nhau. Một số ID người dùng cũng có thể được sử dụng bởi nhiều người đóng góp (ví dụ: các đối tác chia sẻ tài khoản).
Alexis

Câu trả lời:


7

Bạn cũng cần tính đến sự tương đồng giữa các trang web. Một người tham gia vào StackOverflow và Seasoned Advice hoàn hảo hơn so với người tham gia SO và CrossValidated, người đến lượt tôi (tôi sẽ tranh luận) tròn trịa hơn so với người tham gia SO và Lập trình viên . Chắc chắn có nhiều cách để làm điều đó, nhưng bạn có thể kiểm tra đăng ký chồng chéo để cảm nhận về nó.


1
@Matt Parker, điểm tốt - Nếu đại diện là một phần của số liệu, tôi cũng nghĩ bạn cần xem xét cách đại diện đạt được. Một người có được đại diện của họ từ những lợi ích nhỏ trong rất nhiều câu hỏi / câu trả lời có thể sẽ được làm tròn tốt hơn so với người đạt được cùng một đại diện cho một câu hỏi thu được rất nhiều phiếu bầu.
DQdlM

3
@Kenny Đó là một điểm tốt và tôi nghĩ theo cách bạn đã nói là đúng - nhưng tôi cảm thấy như nhiều câu hỏi và câu trả lời được bình chọn nhiều nhất thường ít chỉ ra về chuyên môn, trong khi câu trả lời tốt cho các câu hỏi kỹ thuật thực sự khó hiểu thường có phiếu bầu rất thấp.
Matt Parker

1
Kiểm tra câu trả lời của whuber, ví dụ. Câu trả lời của anh ấy rất tuyệt vời, vậy điều gì phân biệt giữa câu trả lời được đánh giá cao của anh ấy và 1 cử tri của anh ấy? Khi tôi nhìn vào cái trước, tôi thấy những câu trả lời tuyệt vời cho những câu hỏi mà tôi hiểu; sau đó, câu trả lời tuyệt vời cho câu hỏi tôi thậm chí không bắt đầu mò mẫm. Vì vậy, các câu trả lời được bình chọn thấp thực sự có thể là dấu hiệu của sự chuyên môn hóa sâu sắc (nhưng lưu ý: nếu bạn tò mò về một người dùng SE tròn trịa trông như thế nào, thì đây chính là nó ).
Matt Parker

1
Trên thực tế, @Graviton, có thể là khôn ngoan khi tìm kiếm người dùng đa trang web mà bạn cho là hoàn hảo và xem cách họ thực hiện trong các số liệu khác nhau của bạn.
Matt Parker

1
@KennyPeanuts, để bổ sung cho quan điểm của @ Matt ở trên, dường như cũng có một số lượng người dùng đáng kể trên các trang web SE trả lời rất nhiều câu hỏi, nhưng vẫn mang lại một số câu hỏi. Đó thường không phải là chỉ định về chuyên môn hoặc tròn trịa. (Mặc dù, đây một trong những chiến lược dễ nhất để thu hút "danh tiếng").
Đức hồng y

6

VÍ DỤ: giả sử có ba trang web và chúng tôi muốn so sánh mức độ tròn trịa của Người dùng A, B, C. Chúng tôi viết danh tiếng của người dùng trên ba trang web ở dạng vector:

Người dùng A: [23, 23, 0]

Người dùng B: [15, 15, 0]

Người dùng C: [10, 10, 10]

Chúng tôi sẽ xem xét A hoàn hảo hơn B (danh tiếng của họ đều trải đều trên hai trang web, nhưng A có tổng danh tiếng cao hơn). Ngoài ra, chúng tôi sẽ xem xét C được làm tròn tốt hơn B (họ có cùng danh tiếng, nhưng C thậm chí còn lan rộng trên nhiều trang web hơn.) Không quyết định liệu A nên được coi là tròn trịa hơn C hay ngược lại .

xAxBxC

f(x)ff(xA)>f(xB)f(xC)>f(xB)

f(x)

Hai ví dụ phổ biến của các hàm lồi là 'định mức phân số'

f([x1,...,xm])=ixip

0<p<1

p=1/2

f(xA)=2239.6
f(xB)=2157.7
f(xC)=3109.5

1/2

f

f([x1,...,xm])=ixilog(xi/c).

c=ixi

f

f(xA)=46log(2)31.9
f(xB)=30log(2)20.8
f(xC)=30log(3)33.0

Đo theo entropy Shannon được chia tỷ lệ, sau đó, chúng ta sẽ nói C là vòng tròn nhất trong ba và A là vòng tròn thứ hai tốt nhất.

f(x)

EDIT2: Đã thêm một ví dụ dưới ánh sáng của nhận xét.


f

f[1,101]f

Định mức phân số không được xác định khi bất kỳ x_i <0. Entropy của Shannon không thành công khi bất kỳ x_i / c ≤ 0. Điều đó không có nghĩa là một thước đo độ tròn tốt sẽ đột nhiên nổ tung khi một số x_i thay đổi từ 0 thành -𝜀.
200_success

4

Đây là một câu hỏi thực sự, thực sự thú vị (thực sự tôi hơi thích ý tưởng mô hình hóa các trang web trao đổi ngăn xếp nói chung).

Về vấn đề tròn trịa, một cách để đánh giá điều này sẽ thông qua các thẻ mà người dùng cụ thể có xu hướng trả lời và phân phối của họ trên các trang web. Ví dụ có thể làm cho điều này rõ ràng hơn.

Tôi là thành viên trên TeX, StackOverflow, CrossValidated và AskUbfox. Bây giờ, tôi thực sự chỉ đóng góp ở đây và StackOverflow, và chỉ về R trên Stackoverflow. Vì vậy, để xác định độ tròn tốt, tôi sẽ xem xét a) số lượng thẻ mà hai trang web có chung (để xác định độ tương tự giữa các trang web) và mức độ mà người dùng trả lời các câu hỏi trên các trang web có ít hoặc không có thẻ chung.

Ví dụ, nếu ai đó đóng góp vào các thẻ Python trên StackOverflow và nấu ăn, thì người đó được làm tròn hơn so với người trả lời các câu hỏi phần mềm thống kê (ví dụ) về các câu hỏi về Overflow và thống kê ở đây.

Tôi hy vọng điều này là phần nào hữu ích.


4
(+1) Một người nào đó đang đóng góp cho các thẻ Python trên cả SO và nấu ăn có một số mùi vị kỳ lạ trong thực phẩm :-) Tôi nghe nói nó có vị như thịt gà.
whuber

3

Nếu bạn xác định 'tính tròn trịa' là 'đóng góp cho nhiều Trang web trao đổi ngăn xếp khác nhau,' tôi sẽ tính toán một số số liệu đóng góp cho mỗi trang web. Bạn có thể sử dụng tổng số bài viết, hoặc bài viết trung bình mỗi ngày, hoặc có thể là danh tiếng. Sau đó nhìn vào sự phân phối của số liệu này trên tất cả các trang web và tính toán độ lệch của nó theo một cách nào đó có ý nghĩa.

Nói cách khác, một người 'hoàn hảo' sẽ là người đóng góp cho nhiều trang web khác nhau, trong khi một người 'không hoàn hảo' sẽ là người đóng góp chủ yếu vào một trang web. Bạn có thể cải thiện hơn nữa bằng cách nhân rộng số liệu của mình với tổng số người dùng trên tất cả các trang web. tức là ai đó đã đóng góp rất nhiều cho nhiều trang web khác nhau nên được coi là hoàn hảo hơn so với ai đó không đóng góp gì cho bất kỳ trang web nào. Một người không bao giờ sử dụng SE không tròn trịa lắm!


1

Đã có nhiều câu trả lời hay, vậy tại sao một câu trả lời nữa? Điều này chủ yếu là để thu hút sự chú ý đến những ý tưởng thú vị được thảo luận ở đây tại The n-Category Café . Mặc dù sự đa dạng trong sinh thái học (và các nơi khác) chủ yếu chỉ nhìn vào sự phong phú, người ta cũng nên nhìn vào sự giống nhau / không giống nhau của các loài khác nhau.

Bằng cách đại diện cho các loài (hoặc bất cứ thứ gì, như các trang SE ...) làm điểm trong không gian số liệu, điều này dẫn đến việc khái quát hóa entropy cho không gian số liệu, xem ví dụ : entropy tối đa của không gian số liệu của Tom Leinster, Emily Roff . Những ý tưởng tương tự có thể được sử dụng trong các trang web SE bằng cách xem các thẻ dưới dạng các điểm trong không gian số liệu.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.