Thống kê và dữ liệu lớn

Q & A cho những người quan tâm đến thống kê, học máy, phân tích dữ liệu, khai thác dữ liệu và trực quan hóa dữ liệu





2
Phương pháp MCMC - đốt mẫu?
Trong các phương pháp MCMC , tôi tiếp tục đọc về burn-inthời gian hoặc số lượng mẫu "burn". Điều này chính xác là gì, và tại sao nó lại cần thiết? Cập nhật: Khi MCMC ổn định, nó có ổn định không? Làm thế nào là khái niệm về burn-inthời …
12 sampling  mcmc 



2
Thực tiễn tốt nhất để tạo 'Dữ liệu gọn gàng'
Hadley Wickham đã viết một bài báo xuất sắc có tên "Dữ liệu gọn gàng" ( liên kết ) trong JSS năm ngoái về thao tác dữ liệu và đưa dữ liệu vào điều kiện "tối ưu" để thực hiện phân tích. Tuy nhiên, tôi đã tự hỏi những thực …
12 dataset  tables 



1


1
Có cần tiền xử lý trước khi dự đoán bằng FinalModel của RandomForest với gói caret không?
Tôi sử dụng gói caret để huấn luyện một đối tượng RandomForest với 10x10CV. library(caret) tc <- trainControl("repeatedcv", number=10, repeats=10, classProbs=TRUE, savePred=T) RFFit <- train(Defect ~., data=trainingSet, method="rf", trControl=tc, preProc=c("center", "scale")) Sau đó, tôi kiểm tra RandomForest trên testset (dữ liệu mới) RF.testSet$Prediction <- predict(RFFit, newdata=testSet) Ma trận nhầm lẫn …



Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.