Thống kê và dữ liệu lớn

Q & A cho những người quan tâm đến thống kê, học máy, phân tích dữ liệu, khai thác dữ liệu và trực quan hóa dữ liệu


2
Ước tính phân bố hiệp phương sai của một gaussian đa biến
Tôi cần "học" phân phối một gaussian bivariate với một vài mẫu, nhưng một giả thuyết tốt về phân phối trước, vì vậy tôi muốn sử dụng phương pháp bayesian. Tôi định nghĩa trước của tôi: P(μ)∼N(μ0,Σ0)P(μ)∼N(μ0,Σ0) \mathbf{P}(\mathbf{\mu}) \sim \mathcal{N}(\mathbf{\mu_0},\mathbf{\Sigma_0}) μ0=[00] Σ0=[160027]μ0=[00] Σ0=[160027] \mathbf{\mu_0} = \begin{bmatrix} 0 \\ 0 \end{bmatrix} …




1
Tại sao chúng ta ổn định phương sai?
Tôi đã bắt gặp sự biến đổi ổn định phương sai trong khi đọc phương pháp Kaggle Essay Eval . Họ sử dụng một phép biến đổi ổn định phương sai để biến đổi các giá trị kappa trước khi lấy giá trị trung bình của chúng và sau đó …

1
Ý nghĩa của các điều khoản đầu ra trong gói gbm?
Tôi đang sử dụng gói gbm để phân loại. Như mong đợi, kết quả là tốt. Nhưng tôi đang cố gắng để hiểu đầu ra của phân loại. Có năm điều khoản trong đầu ra. `Iter TrainDeviance ValidDeviance StepSize Improve` Bất cứ ai cũng có thể giải thích ý nghĩa …


3
Tại sao sử dụng một biện pháp nhất định về lỗi dự báo (ví dụ MAD) chứ không phải là một biện pháp khác (ví dụ MSE)?
MAD = Độ lệch tuyệt đối trung bình MSE = Lỗi bình phương trung bình Tôi đã thấy các đề xuất từ ​​nhiều nơi khác nhau mà MSE được sử dụng mặc dù có một số phẩm chất không mong muốn (ví dụ: http://www.stat.nus.edu.sg/~staxyc/T12.pdf , nói trên p8 "Người ta …
15 forecasting  error  mse  mae 


7
Rừng ngẫu nhiên là quá mức
Tôi đang cố gắng sử dụng Hồi quy rừng ngẫu nhiên trong scikits-learn. Vấn đề là tôi đang nhận được một lỗi kiểm tra thực sự cao: train MSE, 4.64, test MSE: 252.25. Đây là cách dữ liệu của tôi trông: (màu xanh: dữ liệu thực, màu xanh lá cây: …





Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.