Thống kê và dữ liệu lớn

Q & A cho những người quan tâm đến thống kê, học máy, phân tích dữ liệu, khai thác dữ liệu và trực quan hóa dữ liệu




1
Xác thực chéo (CV) và thống kê xác thực chéo (GCV) tổng quát
Tôi đã tìm thấy các định nghĩa có thể mâu thuẫn đối với thống kê xác thực chéo (CV) và thống kê xác thực chéo (GCV) được liên kết với mô hình tuyến tính (với một vectơ lỗi đồng nhất, bình thường ).εY=Xβ+εY=Xβ+εY = X\boldsymbol\beta + \boldsymbol\varepsilonεε\boldsymbol\varepsilon Một mặt, Golub, …

2
CHAID vs CRT (hoặc GIỎ HÀNG)
Tôi đang chạy phân loại cây quyết định bằng SPSS trên tập dữ liệu với khoảng 20 dự đoán (phân loại với một vài loại). CHAID (Phát hiện tương tác tự động Chi bình phương) và CRT / GIỎI (Phân loại và cây hồi quy) đang cho tôi những cây …
23 spss  cart 


3
Sinh viên t là hỗn hợp của gaussian
Sử dụng phân phối t sinh viên với độ tự do, tham số vị trík>0k>0k > 0lll và tham số tỷ lệsss có mật độ Γ(k+12)Γ(k2kπs2−−−−√){1+k−1(x−ls)}−(k+1)/2,Γ(k+12)Γ(k2kπs2){1+k−1(x−ls)}−(k+1)/2,\frac{\Gamma \left(\frac{k+1}{2}\right)}{\Gamma\left(\frac{k}{2}\sqrt{k \pi s^2}\right)} \left\{ 1 + k^{-1}\left( \frac{x-l}{s}\right)\right\}^{-(k+1)/2}, làm thế nào để chứng minh rằng các sinh viên ttt -distribution có thể được viết …


2
Làm thế nào để xử lý sự khác biệt giữa phân phối của tập kiểm tra và tập huấn luyện?
Tôi nghĩ một giả định cơ bản của học máy hoặc ước lượng tham số là dữ liệu không nhìn thấy đến từ cùng một phân phối với tập huấn luyện. Tuy nhiên, trong một số trường hợp thực tế, việc phân phối bộ kiểm tra sẽ gần như khác …


2
Bayesian trung bình b gậy trước
Tôi muốn hỏi một câu hỏi lấy cảm hứng từ một câu trả lời xuất sắc cho truy vấn về trực giác cho bản phân phối beta. Tôi muốn có được một sự hiểu biết tốt hơn về sự phát sinh cho phân phối trước cho mức trung bình. Có …
23 bayesian  prior 





Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.