Thống kê và dữ liệu lớn

Q & A cho những người quan tâm đến thống kê, học máy, phân tích dữ liệu, khai thác dữ liệu và trực quan hóa dữ liệu


3
Giải thích chính quy sườn núi trong hồi quy
Tôi có một số câu hỏi liên quan đến hình phạt sườn núi trong bối cảnh bình phương nhỏ nhất: βridge=(λID+X′X)−1X′yβridge=(λID+X′X)−1X′y\beta_{ridge} = (\lambda I_D + X'X)^{-1}X'y 1) Biểu thức cho thấy ma trận hiệp phương sai của X được thu nhỏ theo ma trận đường chéo, nghĩa là (giả sử …



2
Mối tương quan giữa các công cụ ước tính OLS cho đánh chặn và độ dốc
Trong mô hình hồi quy đơn giản, y=β0+β1x+ε,y=β0+β1x+ε, y = \beta_0 + \beta_1 x + \varepsilon, các công cụ ước tính OLS và có mối tương quan với nhau.ββ^OLS0β^0OLS\hat{\beta}_0^{OLS}β^OLS1β^1OLS\hat{\beta}_1^{OLS} Công thức cho mối tương quan giữa hai công cụ ước tính là (nếu tôi đã dẫn xuất chính xác): Corr(β^OLS0,β^OLS1)=−∑ni=1xin−−√∑ni=1x2i−−−−−−−√.Corr⁡(β^0OLS,β^1OLS)=−∑i=1nxin∑i=1nxi2. …




5
Làm thế nào để tạo ra một ma trận tương quan ngẫu nhiên đầy đủ thứ hạng lớn với một số tương quan mạnh hiện tại?
Tôi muốn tạo một ma trận tương quan ngẫu nhiên có kích thước sao cho có một số tương quan mạnh vừa phải hiện diện: n × nCC\mathbf Cn×nn×nn \times n ma trận đối xứng thực vuông có kích thước , ví dụ ;n = 100n×nn×nn \times nn=100n=100n=100 tích cực-xác …



2
Làm thế nào để sử dụng kết quả R prcomp để dự đoán?
Tôi có một data.frame với 800 obs. trong số 40 biến và muốn sử dụng Phân tích thành phần nguyên tắc để cải thiện kết quả dự đoán của tôi (cho đến nay vẫn hoạt động tốt nhất với Support Vector Machine trên khoảng 15 biến được chọn bằng tay). …
25 r  pca 


3
LSA so với PCA (phân cụm tài liệu)
Tôi đang điều tra các kỹ thuật khác nhau được sử dụng trong phân cụm tài liệu và tôi muốn xóa một số nghi ngờ liên quan đến PCA (phân tích thành phần chính) và LSA (phân tích ngữ nghĩa tiềm ẩn). Điều đầu tiên - sự khác biệt giữa …


Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.