Thống kê và dữ liệu lớn

Q & A cho những người quan tâm đến thống kê, học máy, phân tích dữ liệu, khai thác dữ liệu và trực quan hóa dữ liệu

2
REML hoặc ML để so sánh hai mô hình hiệu ứng hỗn hợp với các hiệu ứng cố định khác nhau, nhưng có cùng hiệu ứng ngẫu nhiên không?
Bối cảnh: Lưu ý: Tập dữ liệu và mã r của tôi được bao gồm bên dưới văn bản Tôi muốn sử dụng AIC để so sánh hai mô hình hiệu ứng hỗn hợp được tạo bằng gói lme4 trong R. Mỗi mô hình có một hiệu ứng cố định …

5
Liệu -squared có giá trị ?
Tôi dường như đã bối rối khi cố gắng hiểu nếu một giá trị -quared cũng có giá trị .prrrppp Theo tôi hiểu, trong tương quan tuyến tính với một tập hợp các điểm dữ liệu có thể có giá trị nằm trong khoảng từ đến và giá trị này, …



5
Biến thể trong kết quả cv.glmnet
Tôi đang sử dụng cv.glmnetđể tìm dự đoán. Thiết lập tôi sử dụng như sau: lassoResults<-cv.glmnet(x=countDiffs,y=responseDiffs,alpha=1,nfolds=cvfold) bestlambda<-lassoResults$lambda.min results<-predict(lassoResults,s=bestlambda,type="coefficients") choicePred<-rownames(results)[which(results !=0)] Để đảm bảo kết quả là tái sản xuất tôi set.seed(1). Các kết quả rất khác nhau. Tôi đã chạy chính xác mã 100 để xem kết quả biến như …






3
Bình thường hóa có nghĩa là gì và làm thế nào để xác minh rằng một mẫu hoặc phân phối được chuẩn hóa?
Tôi có một câu hỏi trong đó nó yêu cầu xác minh xem liệu phân phối Đồng phục ( ) có được chuẩn hóa hay không.Uniform(a,b)Uniform(a,b){\rm Uniform}(a,b) Đối với một, nó có nghĩa là gì đối với bất kỳ phân phối được chuẩn hóa? Và hai, làm thế nào để …

2
Bốn trục trên biplot PCA là gì?
Khi bạn xây dựng một biplot cho phân tích PCA, bạn có điểm PC1 thành phần chính trên trục x và điểm PC2 trên trục y. Nhưng hai trục còn lại ở bên phải và trên cùng của màn hình là gì?
18 r  pca  biplot 

2
sử dụng trọng lượng trong svyglm vs glm
Tôi muốn biết cách điều trị của trọng lượng khác nhau giữa svyglmvàglm Tôi đang sử dụng twanggói trong R để tạo điểm số xu hướng sau đó được sử dụng làm trọng số, như sau (mã này xuất phát từ twangtài liệu): library(twang) library(survey) set.seed(1) data(lalonde) ps.lalonde <- ps(treat …
18 r  survey 

2
Phát hiện bất thường với các tính năng giả (và các tính năng rời rạc / phân loại khác)
tl; dr Cách được đề xuất để đối phó với discretedữ liệu khi thực hiện phát hiện bất thường là gì? Cách được đề xuất để đối phó với categoricaldữ liệu khi thực hiện phát hiện bất thường là gì? Câu trả lời này gợi ý sử dụng dữ liệu …


Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.