Thống kê và dữ liệu lớn

Q & A cho những người quan tâm đến thống kê, học máy, phân tích dữ liệu, khai thác dữ liệu và trực quan hóa dữ liệu





4
Khi nào ước tính bootstrap của bias là hợp lệ?
Người ta thường tuyên bố rằng bootstrapping có thể cung cấp ước tính sai lệch trong công cụ ước tính. Nếu là ước tính cho một số thống kê và là bản sao bootstrap (với ), thì ước tính sai lệch bootstrap là có vẻ cực kỳ đơn giản và …
31 bootstrap  bias 



2
Tầm quan trọng tương đối của một nhóm các yếu tố dự báo trong phân loại rừng ngẫu nhiên ở R
Tôi muốn xác định tầm quan trọng tương đối của các bộ biến đối với randomForestmô hình phân loại trong R. importanceHàm cung cấp MeanDecreaseGinisố liệu cho từng dự đoán riêng lẻ - có đơn giản như việc tính tổng này qua từng bộ dự báo trong một bộ không? …

3
Lỗi bình phương trung bình và tổng bình phương còn lại
Nhìn vào các định nghĩa Wikipedia về: Lỗi bình phương trung bình (MSE) Tổng số bình phương (RSS) Dường như với tôi rằng MSE = 1NRSS = 1N∑ ( ftôi- ytôi)2MSE= =1NRSS= =1NΣ(ftôi-ytôi)2\text{MSE} = \frac{1}{N} \text{RSS} = \frac{1}{N} \sum (f_i -y_i)^2 Trong đó là số mẫu của anh ta và …
31 residuals  mse 

2
định dạng dữ liệu libsvm [đã đóng]
Tôi đang sử dụng công cụ libsvm ( http://www.csie.ntu.edu.tw/~cjlin/libsvm/ ) để hỗ trợ phân loại vector. Tuy nhiên, tôi bối rối về định dạng của dữ liệu đầu vào. Từ README: Định dạng của tệp dữ liệu đào tạo và kiểm tra là: <label> <index1>:<value1> <index2>:<value2> ... . . . …






Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.