Thống kê và dữ liệu lớn

Q & A cho những người quan tâm đến thống kê, học máy, phân tích dữ liệu, khai thác dữ liệu và trực quan hóa dữ liệu

3
Đối với phân loại tuyến tính, các hệ số lớn hơn có nghĩa là các tính năng quan trọng hơn?
Tôi là một kỹ sư phần mềm làm việc về học máy. Theo hiểu biết của tôi, hồi quy tuyến tính (như OLS) và phân loại tuyến tính (như hồi quy logistic và SVM) đưa ra dự đoán dựa trên một sản phẩm bên trong giữa các hệ số được …



2
Phương sai xác thực chéo bỏ qua một lần
Tôi đọc đi đọc lại rằng xác thực chéo "Bỏ qua một lần" có phương sai cao do sự chồng chéo lớn của các nếp gấp đào tạo. Tuy nhiên tôi không hiểu tại sao đó là: Không phải hiệu suất của xác thực chéo sẽ rất ổn định (phương …

3
Một mô hình cho dữ liệu không âm với việc đóng cục ở các số không (Tweedie GLM, GLM không phồng, v.v.) có thể dự đoán các số không chính xác không?
Phân phối Tweedie có thể mô hình hóa dữ liệu bị lệch với khối lượng điểm bằng 0 khi tham số (số mũ trong mối quan hệ phương sai trung bình) nằm trong khoảng từ 1 đến 2.ppp Tương tự như vậy, một mô hình không phồng lên (dù là …



2
Giải thích khoảng tin cậy
Lưu ý: xin lỗi trước nếu đây là bản sao, tôi không tìm thấy q tương tự trong tìm kiếm của mình Nói rằng chúng ta có một tham số đúng p. Khoảng tin cậy C (X) là RV chứa p, chiếm 95% thời gian. Bây giờ giả sử chúng …







3
Chọn K tối ưu cho KNN
Tôi đã thực hiện CV gấp 5 lần để chọn K tối ưu cho KNN. Và có vẻ như K càng lớn, lỗi càng nhỏ ... Xin lỗi tôi không có một huyền thoại, nhưng các màu sắc khác nhau đại diện cho các thử nghiệm khác nhau. Có tổng …

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.