"Không có phương pháp đồ họa" là một sự bất lợi lớn, nhưng ... đây là một vài ý tưởng kỳ quặc. Cả hai đều coi xếp hạng là liên tục, đó là một điểm yếu về mặt khái niệm và có lẽ không phải là duy nhất ...
Kurtosis
- Kurtosis của {1,1,1,5,5,5} = 1. Bạn sẽ không nhận được mức độ tổn thương thấp hơn với bất kỳ kết hợp nào của 1 Xếp hạng5.
- Sự suy yếu của {1,2,3,4,5} = 1,7. Thấp hơn có nghĩa là giá trị cực đoan hơn; cao hơn có nghĩa là trung bình hơn.
- Điều này sẽ không hoạt động nếu phân phối không đối xứng. Tôi sẽ trình bày dưới đây.
Hồi quy nhị thức âm
Với khung dữ liệu như thế này: Phù hợp với mô hình F r e q u e n c
Rating12345Frequency31157937
sử dụng hồi quy nhị thức âm. các
√Frequency∼Rating+Rating−−−−−−√ phải gần bằng 0 nếu xếp hạng được
phân bố đồng đều, dương nếu có các giá trị trung bình tỷ lệ thuận hơn (
phân phối nhị thức) hoặc âm với các phân phối phân cực như ở trên, với hệ số này là - 11.8.
Rating−−−−−−√
FWIW, đây là mã r tôi đã chơi xung quanh:
x=rbinom(99,4,c(.1,.9))+1;y=sample(0:4,99,replace=T)+1 #Some polarized & uniform rating data
table(x);table(y) #Frequencies
require(moments);kurtosis(x);kurtosis(y) #Kurtosis
Y=data.frame(n=as.numeric(table(y)),rating=as.numeric(levels(factor(y)))) #Data frame setup
X=data.frame(n=as.numeric(table(x)),rating=as.numeric(levels(factor(x)))) #Data frame setup
require(MASS);summary(glm.nb(n~rating+sqrt(rating),X)) #Negative binomial of polarized data
summary(glm.nb(n~rating+sqrt(rating),Y)) #Negative binomial of uniform data
Không thể cưỡng lại việc ném vào một âm mưu ...
require(ggplot2);ggplot(X,aes(x=rating,y=n))+geom_point()+stat_smooth(formula=y~x+I(sqrt(x)),method='glm',family='poisson')
các Rating−−−−−−√
Chỉnh sửa: Chỉ thấy câu hỏi này được quảng cáo trên thanh bên:
và khi tôi nhấp vào, tôi đã thấy nó trong Câu hỏi về Mạng nóng liên kết lại với chính nó, như đôi khi xảy ra ,
Vì vậy, tôi nghĩ rằng điều này có thể xứng đáng được xem xét lại theo cách hữu ích hơn. Tôi đã quyết định thử các phương pháp của mình trên các đánh giá của khách hàng trên Amazon cho Tee Mountain ngắn tay của The Mountain Three Wolf :
RatingFrequency1208254389419852273
βRating√=−19.1
σ2FrequencyThe Mountain Three Wolf Moon Short Sleeve Tee Ratings=1.31 ...
và với x=rep(5:1,c(2273,198,89,54,208))
, chỉ số phân cực của @ Glen_b var(x)/(4*length(x)/(length(x)-1))
= .33 ... chỉ cần nói.