Thống kê và dữ liệu lớn

Q & A cho những người quan tâm đến thống kê, học máy, phân tích dữ liệu, khai thác dữ liệu và trực quan hóa dữ liệu







1
Bằng chứng về việc thu hẹp các hệ số bằng cách sử dụng hồi quy sườn thông qua phân rã phổ
Tôi đã hiểu làm thế nào hồi quy sườn núi thu nhỏ các hệ số về không về mặt hình học. Hơn nữa, tôi biết làm thế nào để chứng minh điều đó trong "Trường hợp đặc biệt", nhưng tôi bối rối không biết nó hoạt động như thế nào …

7
Tại sao ma trận xác định dương tính đối xứng (SPD) rất quan trọng?
Tôi biết định nghĩa của ma trận xác định dương tính đối xứng (SPD), nhưng muốn hiểu thêm. Tại sao chúng rất quan trọng, bằng trực giác? Đây là những gì tôi biết. Còn gì nữa không Đối với một dữ liệu nhất định, ma trận Co-variance là SPD. Ma …





1
Nếu LASSO tương đương với hồi quy tuyến tính với Laplace trước thì làm sao có thể có khối lượng trên các tập hợp với các thành phần bằng 0?
Tất cả chúng ta đều quen thuộc với khái niệm, được ghi lại trong tài liệu, rằng tối ưu hóa LASSO (vì đơn giản là chú ý đến trường hợp hồi quy tuyến tính) tương đương với mô hình tuyến tính có lỗi Gaussian trong đó các tham số được …

1
Splines có thể được sử dụng để dự đoán?
Tôi không thể cụ thể về bản chất của dữ liệu vì nó là độc quyền, nhưng giả sử chúng tôi có dữ liệu như thế này: Mỗi tháng, một số người đăng ký dịch vụ. Sau đó, trong mỗi tháng tiếp theo, những người đó có thể nâng cấp …

5
Tại sao chúng ta sử dụng công thức độ lệch chuẩn sai lệch và sai lệch cho của phân phối bình thường?
Tôi cảm thấy hơi sốc khi lần đầu tiên tôi thực hiện mô phỏng Monte Carlo phân phối bình thường và phát hiện ra rằng giá trị trung bình của độ lệch chuẩn từ mẫu, tất cả đều có cỡ mẫu chỉ , được chứng minh là ít hơn nhiều …

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.