Thống kê và dữ liệu lớn

Q & A cho những người quan tâm đến thống kê, học máy, phân tích dữ liệu, khai thác dữ liệu và trực quan hóa dữ liệu






3
Dự đoán phương sai của dữ liệu không đồng nhất
Tôi đang cố gắng thực hiện hồi quy trên dữ liệu không đồng nhất trong đó tôi đang cố gắng dự đoán các phương sai lỗi cũng như các giá trị trung bình theo mô hình tuyến tính. Một cái gì đó như thế này: y(x,t)ξ(x,t)y¯(x,t)σ(x,t)=y¯(x,t)+ξ(x,t),∼N(0,σ(x,t)),=y0+ax+bt,=σ0+cx+dt.y(x,t)=y¯(x,t)+ξ(x,t),ξ(x,t)∼N(0,σ(x,t)),y¯(x,t)=y0+ax+bt,σ(x,t)=σ0+cx+dt.\begin{align}\\ y\left(x,t\right) &= \bar{y}\left(x,t\right)+\xi\left(x,t\right),\\ \xi\left(x,t\right) …



2
Hồi quy sườn - giải thích Bayes
Tôi đã nghe nói rằng hồi quy sườn có thể được coi là giá trị trung bình của phân phối sau, nếu ưu tiên được chọn đầy đủ. Có phải trực giác rằng các ràng buộc như được đặt trên các hệ số hồi quy theo trước (ví dụ: phân …

3
SVM cho dữ liệu không cân bằng
Tôi muốn thử sử dụng Support Vector Machines (SVM) trên tập dữ liệu của mình. Trước khi tôi thử vấn đề, tôi đã được cảnh báo rằng các SVM không hoạt động tốt trên dữ liệu cực kỳ mất cân bằng. Trong trường hợp của tôi, tôi có thể có …



2
Tính toán AIC bằng tay bằng tay trong R
Tôi đã thử tính AIC của hồi quy tuyến tính trong R nhưng không sử dụng AIChàm, như thế này: lm_mtcars <- lm(mpg ~ drat, mtcars) nrow(mtcars)*(log((sum(lm_mtcars$residuals^2)/nrow(mtcars))))+(length(lm_mtcars$coefficients)*2) [1] 97.98786 Tuy nhiên, AICđưa ra một giá trị khác: AIC(lm_mtcars) [1] 190.7999 Ai đó có thể cho tôi biết những gì tôi …


4
Cạm bẫy cần tránh khi chuyển đổi dữ liệu?
Tôi đã đạt được mối quan hệ tuyến tính mạnh mẽ giữa biến XXX và YYY sau khi chuyển đổi gấp đôi đáp ứng. Mô hình này là Y∼XY∼XY\sim X nhưng tôi chuyển nó đến cải thiệnR2từ 0,19 đến 0,76.YX−−√∼X−−√YX∼X\sqrt{\frac{Y}{X}}\sim \sqrt{X}R2R2R^2 Rõ ràng tôi đã làm một số phẫu thuật …

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.