Thống kê và dữ liệu lớn

Q & A cho những người quan tâm đến thống kê, học máy, phân tích dữ liệu, khai thác dữ liệu và trực quan hóa dữ liệu


4
Phân loại với dữ liệu chất béo cao
Tôi cần đào tạo một trình phân loại tuyến tính trên máy tính xách tay của mình với hàng trăm nghìn điểm dữ liệu và khoảng mười nghìn tính năng. Những lựa chọn của tôi là gì? Tình trạng của nghệ thuật cho loại vấn đề này là gì? Có …



2
Phân vùng cây trong R: party vs. rpart
Lâu lắm rồi tôi mới nhìn phân vùng cây. Lần trước tôi đã làm điều này, tôi thích tiệc tùng trong R (được tạo bởi Hothorn). Ý tưởng về suy luận có điều kiện thông qua lấy mẫu có ý nghĩa với tôi. Nhưng rpart cũng đã kháng cáo. Trong …
15 r  cart  rpart  partitioning 




3
Khi nào nên cân nhắc sử dụng GMM?
Một trong những điều làm cho kinh tế lượng trở nên độc đáo là việc sử dụng kỹ thuật Phương pháp tổng quát về các khoảnh khắc. Những loại vấn đề nào làm cho GMM phù hợp hơn các kỹ thuật ước tính khác? Điều gì sử dụng GMM mua …



4
Sự tương quan là gì nếu độ lệch chuẩn của một biến là 0?
Theo tôi hiểu, chúng ta có thể có được mối tương quan bằng cách bình thường hóa hiệp phương sai bằng phương trình ρi,j=cov(Xi,Xj)σiσjρi,j=cov(Xi,Xj)σiσj\rho_{i,j}=\frac{cov(X_i, X_j)}{\sigma_i \sigma_j} trong đó là độ lệch chuẩn củaXi.σi=E[(Xi−μi)2]−−−−−−−−−−−√σi=E[(Xi−μi)2]\sigma_i=\sqrt{E[(X_i-\mu_i)^2]}XiXiX_i Mối quan tâm của tôi là gì nếu độ lệch chuẩn bằng 0? Có điều kiện nào …




Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.