Thống kê và dữ liệu lớn

Q & A cho những người quan tâm đến thống kê, học máy, phân tích dữ liệu, khai thác dữ liệu và trực quan hóa dữ liệu



2
Làm thế nào để giảm số lượng vật phẩm bằng cách sử dụng phân tích nhân tố, tính nhất quán nội bộ và lý thuyết phản hồi vật phẩm kết hợp?
Tôi đang trong quá trình phát triển một bảng câu hỏi theo kinh nghiệm và tôi sẽ sử dụng các số tùy ý trong ví dụ này để minh họa. Đối với bối cảnh, tôi đang phát triển một bảng câu hỏi tâm lý nhằm đánh giá các kiểu suy …


1
Điều chỉnh sai lệch là gì? [đóng cửa]
Đã đóng cửa . Câu hỏi này cần chi tiết hoặc rõ ràng . Nó hiện không chấp nhận câu trả lời. Bạn muốn cải thiện câu hỏi này? Thêm chi tiết và làm rõ vấn đề bằng cách chỉnh sửa bài đăng này . Đóng cửa 4 năm trước …



1
Làm cách nào để tối ưu hóa hiệu quả tính toán khi lắp mô hình phức tạp vào tập dữ liệu lớn nhiều lần?
Tôi gặp vấn đề về hiệu năng khi sử dụng MCMCglmmgói trong R để chạy mô hình hiệu ứng hỗn hợp. Mã trông như thế này: MC1<-MCMCglmm(bull~1,random=~school,data=dt,family="categorical" , prior=list(R=list(V=1,fix=1), G=list(G1=list(V=1, nu=0))) , slice=T, nitt=iter, ,burnin=burn, verbose=F) Có khoảng 20.000 quan sát trong dữ liệu và chúng được tập hợp trong …

2
Phân tích hồi quy logistic
Câu hỏi này là loại chung chung và dài dòng, nhưng xin vui lòng chịu đựng với tôi. Trong ứng dụng của mình, tôi có nhiều bộ dữ liệu, mỗi bộ gồm ~ 20.000 datapoint với ~ 50 tính năng và một biến nhị phân phụ thuộc duy nhất. Tôi …




1
Làm thế nào để tạo dự đoán với rjags?
Tôi đã sử dụng rjags để chạy MCMC trên một mô hình, được chỉ định bằng ngôn ngữ JAGS. Có cách nào tốt để trích xuất mô hình đó và thực hiện dự đoán với nó không (sử dụng phân phối sau của các tham số của tôi)? Tôi có …
12 r  jags 

2
Tự động xác định phân phối xác suất cho một tập dữ liệu
Đưa ra một tập dữ liệu: x <- c(4.9958942,5.9730174,9.8642732,11.5609671,10.1178216,6.6279774,9.2441754,9.9419299,13.4710469,6.0601435,8.2095239,7.9456672,12.7039825,7.4197810,9.5928275,8.2267352,2.8314614,11.5653497,6.0828073,11.3926117,10.5403929,14.9751607,11.7647580,8.2867261,10.0291522,7.7132033,6.3337642,14.6066222,11.3436587,11.2717791,10.8818323,8.0320657,6.7354041,9.1871676,13.4381778,7.4353197,8.9210043,10.2010750,11.9442048,11.0081195,4.3369520,13.2562675,15.9945674,8.7528248,14.4948086,14.3577443,6.7438382,9.1434984,15.4599419,13.1424011,7.0481925,7.4823108,10.5743730,6.4166006,11.8225244,8.9388744,10.3698150,10.3965596,13.5226492,16.0069239,6.1139247,11.0838351,9.1659242,7.9896031,10.7282936,14.2666492,13.6478802,10.6248561,15.3834373,11.5096033,14.5806570,10.7648690,5.3407430,7.7535042,7.1942866,9.8867927,12.7413156,10.8127809,8.1726772,8.3965665) .. Tôi muốn xác định phân phối xác suất phù hợp nhất (gamma, beta, bình thường, hàm mũ, poisson, chi bình phương, v.v.) với ước tính của các tham số. Tôi đã biết câu hỏi trên liên kết sau, nơi giải …


Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.