Thống kê và dữ liệu lớn

Q & A cho những người quan tâm đến thống kê, học máy, phân tích dữ liệu, khai thác dữ liệu và trực quan hóa dữ liệu

1
Định lý cơ bản của Dịch vụ phân tích nhân tố học áp dụng cho PCA như thế nào, hoặc tải PCA được định nghĩa như thế nào?
Tôi hiện đang trải qua một bộ slide tôi có để "phân tích nhân tố" (PCA theo như tôi có thể nói). Trong đó, "định lý cơ bản của phân tích nhân tố" được đưa ra, tuyên bố rằng ma trận tương quan của dữ liệu đi vào phân tích …



5
Chính xác dữ liệu bị kiểm duyệt là gì?
Tôi đã đọc các mô tả khác nhau về dữ liệu bị kiểm duyệt: A) Như đã giải thích trong chủ đề này , dữ liệu không đủ điều kiện bên dưới hoặc trên một ngưỡng nhất định được kiểm duyệt. Không đủ điều kiện có nghĩa là dữ liệu …


1
Làm thế nào để sử dụng Phương pháp Delta trong khi đạo hàm bậc nhất bằng không?
http://en.wikipedia.org/wiki/Delta_method Trong bài viết trên Wikipedia, người ta cho rằng g′(θ)g′(θ)g'(\theta) phải tồn tại và rằng g′(θ)g′(θ)g'(\theta) là khác không có giá trị. Là nó có thể tìm thấy sự phân bố tiệm cận cho n−−√(g(Xn)−g(θ))n(g(Xn)−g(θ))\sqrt{n}(g(X_n)-g(\theta)) cho rằngg′(θ)g′(θ)g'(\theta)có thể là zero và?n−−√(Xn−θ)→dN(0,σ2)n(Xn−θ)→dN(0,σ2)\sqrt{n}(X_n-\theta) \stackrel{d}{\rightarrow} N(0,\sigma^2)


1
Các nhóm tự tin cho dòng QQ
Câu hỏi này không liên quan cụ thể R, nhưng tôi đã chọn sử dụng Rđể minh họa nó. Xem xét mã để sản xuất các dải tin cậy quanh một qq-line (bình thường): library(car) library(MASS) b0<-lm(deaths~.,data=road) qqPlot(b0$resid,pch=16,line="robust") Tôi đang tìm kiếm một lời giải thích (hoặc thay thế một …

2
k-nghĩa vs k-trung?
Tôi biết có thuật toán phân cụm k-mean và k-median. Một cái sử dụng giá trị trung bình là trung tâm của cụm và cái còn lại sử dụng trung vị. Câu hỏi của tôi là: khi nào / sử dụng ở đâu?





3
Tính toán phân kỳ Kullback-Leibler trong thực tế?
Tôi đang sử dụng Phân kỳ KL làm thước đo cho sự khác biệt giữa 2 p.m.f.p.m.f.p.m.f. PPP và QQQ . =-∑P(Xi)ln(Q(Xi))+∑P(Xi)ln(P(Xi))DKL(P||Q)=∑i=1Nln(PiQi)PiDKL(P||Q)=∑i=1Nln⁡(PiQi)PiD_{KL}(P||Q) = \sum_{i=1}^N \ln \left( \frac{P_i}{Q_i} \right) P_i =−∑P(Xi)ln(Q(Xi))+∑P(Xi)ln(P(Xi))=−∑P(Xi)ln(Q(Xi))+∑P(Xi)ln(P(Xi))=-\sum P(X_i)ln\left(Q(X_i)\right) + \sum P(X_i)ln\left(P(X_i)\right) Nếu thì chúng ta có thể dễ dàng tính được rằng P ( X i ) …


Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.