Thống kê và dữ liệu lớn

Q & A cho những người quan tâm đến thống kê, học máy, phân tích dữ liệu, khai thác dữ liệu và trực quan hóa dữ liệu



2
Khi nào MCMC hữu ích?
Tôi gặp khó khăn trong việc hiểu cách tiếp cận MCMC thực sự hữu ích trong tình huống nào. Tôi đang xem qua một ví dụ về đồ chơi từ cuốn sách Kruschke "Thực hiện phân tích dữ liệu Bayes: Hướng dẫn với R và BUGS". Những gì tôi hiểu …
12 mcmc 


3
Tại sao không phải là phương pháp nắm giữ (chia dữ liệu thành đào tạo và thử nghiệm) được sử dụng trong thống kê cổ điển?
Trong lớp học của tôi tiếp xúc với khai thác dữ liệu, phương pháp nắm giữ được giới thiệu như một cách đánh giá hiệu suất mô hình. Tuy nhiên, khi tôi học lớp đầu tiên về các mô hình tuyến tính, điều này không được giới thiệu như một …



1
k-nghĩa là | | aka K-Means ++ có thể mở rộng
Bahman Bahmani et al. giới thiệu k-nghĩa | |, đây là phiên bản nhanh hơn của k-nghĩa ++. Thuật toán này được lấy từ trang 4 của bài báo của họ , Bahmani, B., Moseley, B., Vattani, A., Kumar, R., & Vassilvitskii, S. (2012). Khả năng mở rộng k-nghĩa là …

4
Là bất đẳng thức tam giác được thực hiện cho các khoảng cách dựa trên tương quan?
Để phân cụm theo phân cấp, tôi thường thấy hai "số liệu" sau đây (chúng không nói chính xác) để đo khoảng cách giữa hai biến ngẫu nhiên XXX và YYY : \newcommand{\Cor}{\mathrm{Cor}} d1(X,Y)d2(X,Y)=1−|Cor(X,Y)|,=1−(Cor(X,Y))2d1(X,Y)=1−|Cor(X,Y)|,d2(X,Y)=1−(Cor(X,Y))2\begin{align} d_1(X,Y) &= 1-|\Cor(X,Y)|, \\ d_2(X,Y) &= 1-(\Cor(X,Y))^2 \end{align} Có ai thực hiện bất đẳng thức tam …




1
Sự thay thế quá mức và mô hình hóa trong các mô hình hiệu ứng ngẫu nhiên Poisson với độ lệch
Tôi đã gặp một số câu hỏi thực tế khi mô hình hóa dữ liệu đếm từ nghiên cứu thử nghiệm bằng cách sử dụng thử nghiệm bên trong chủ đề. Tôi mô tả ngắn gọn về thí nghiệm, dữ liệu và những gì tôi đã làm cho đến nay, …

2
Cách tìm
Làm sao tôi có thể giải quyết việc này? Tôi cần phương trình trung gian. Có lẽ câu trả lời là −tf(x)−tf(x)-tf(x) . ddt[∫∞txf(x)dx]ddt[∫t∞xf(x)dx] \frac{d}{dt} \left [\int_t^\infty xf(x)\,dx \right ] f(x)f(x)f(x) là hàm mật độ xác suất. Đó là để nói, limx→∞f(x)=0limx→∞f(x)=0\lim\limits_{x \to \infty} f(x) = 0 và limx→∞F(x)=1limx→∞F(x)=1\lim\limits_{x \to …


Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.