Thống kê và dữ liệu lớn

Q & A cho những người quan tâm đến thống kê, học máy, phân tích dữ liệu, khai thác dữ liệu và trực quan hóa dữ liệu

3
Khả năng so với phân phối có điều kiện để phân tích Bayes
Chúng ta có thể viết định lý Bayes như p ( q | x ) = f( X| θ)p(θ)∫θf( X| θ)p(θ)dθp(θ|x)=f(X|θ)p(θ)∫θf(X|θ)p(θ)dθp(\theta|x) = \frac{f(X|\theta)p(\theta)}{\int_{\theta} f(X|\theta)p(\theta)d\theta} Trong đó là hậu thế, là phân phối có điều kiện và là trước.p ( θ | x )p(θ|x)p(\theta|x)f( X| θ)f(X|θ)f(X|\theta)p ( θ )p(θ)p(\theta) hoặc là …

5
Sách hay về khai thác văn bản?
Xin chào Tôi muốn biết nếu có một số cuốn sách hay về khai thác và phân loại văn bản với một số nghiên cứu điển hình?. Nếu không một số giấy tờ / tạp chí có thể truy cập công khai sẽ làm. Nếu họ minh họa ví dụ …





1
Dư Schoenfeld
Trong mô hình rủi ro tỷ lệ Cox có nhiều biến, nếu phần dư Schoenfeld không bằng phẳng cho một trong các biến, điều này có làm mất hiệu lực toàn bộ mô hình hay chỉ có thể bỏ qua biến hoạt động kém? Đó là, giải thích các hệ …

2
Tham số phân tán trong đầu ra GLM
Tôi đã chạy một glm trong R, và gần dưới cùng của summary()đầu ra, nó nói (Dispersion parameter for gaussian family taken to be 28.35031) Tôi đã thực hiện một số thao tác trên Google và biết rằng tham số phân tán được sử dụng để phù hợp với các …








Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.