Thống kê và dữ liệu lớn

Q & A cho những người quan tâm đến thống kê, học máy, phân tích dữ liệu, khai thác dữ liệu và trực quan hóa dữ liệu







3
Định nghĩa và nguồn gốc của entropy chéo Cross
Không cần trích dẫn nguồn, Wikipedia định nghĩa entropy chéo của các phân phối rời rạc và Q làPPPQQQ H×( P; Q )= - Σxp ( x )đăng nhậpq( x ) .H×(P;Q)= =-Σxp(x)đăng nhập⁡q(x).\begin{align} \mathrm{H}^{\times}(P; Q) &= -\sum_x p(x)\, \log q(x). \end{align} Ai là người đầu tiên bắt đầu sử …



2
Tạo ba biến ngẫu nhiên phân bố đồng đều tương quan
Giả sử chúng ta có X 2 ~ unif ( n , 0 , 1 ) ,X1∼unif(n,0,1),X1∼unif(n,0,1),X_1 \sim \textrm{unif}(n,0,1), X2∼unif(n,0,1),X2∼unif(n,0,1),X_2 \sim \textrm{unif}(n,0,1), trong đó là mẫu ngẫu nhiên đồng nhất có kích thước n vàunif(n,0,1)unif(n,0,1)\textrm{unif}(n,0,1) Y=X1,Y=X1,Y=X_1, Z=0.4X1+1−0.4−−−−−−√X2.Z=0.4X1+1−0.4X2.Z = 0.4 X_1 + \sqrt{1 - 0.4}X_2. Khi đó tương quan giữa và …



2
Chuỗi thời gian và phát hiện bất thường
Tôi muốn thiết lập một thuật toán để phát hiện sự bất thường trong chuỗi thời gian và tôi dự định sử dụng phân cụm cho điều đó. Tại sao tôi nên sử dụng ma trận khoảng cách để phân cụm chứ không phải dữ liệu chuỗi thời gian thô?, …



Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.