Thống kê và dữ liệu lớn

Q & A cho những người quan tâm đến thống kê, học máy, phân tích dữ liệu, khai thác dữ liệu và trực quan hóa dữ liệu

3
Dự đoán lỗi - dẫn xuất
Tôi đang đấu tranh để hiểu đạo hàm của lỗi dự đoán dự kiến ​​ở bên dưới (ESL), đặc biệt là về đạo hàm 2,11 và 2,12 (điều hòa, bước tiến tới mức tối thiểu theo điểm). Bất kỳ con trỏ hoặc liên kết nhiều đánh giá cao. Dưới đây …





2
Làm thế nào và tại sao Batch Chuẩn hóa sử dụng các đường trung bình di động để theo dõi độ chính xác của mô hình khi nó đào tạo?
Tôi đã đọc giấy bình thường hóa hàng loạt (BN) (1) và không hiểu nhu cầu sử dụng đường trung bình di động để theo dõi độ chính xác của mô hình và ngay cả khi tôi chấp nhận rằng đó là điều đúng đắn, tôi không hiểu những gì …


1
Lợi ích của việc phân tầng so với lấy mẫu ngẫu nhiên để tạo dữ liệu đào tạo trong phân loại
Tôi muốn biết nếu có bất kỳ / một số lợi thế của việc sử dụng lấy mẫu phân tầng thay vì lấy mẫu ngẫu nhiên, khi tách tập dữ liệu gốc thành tập huấn luyện và kiểm tra để phân loại. Ngoài ra, lấy mẫu phân tầng có đưa …

1
Thảo luận về overfit trong xgboost
Thiết lập của tôi là như sau: Tôi đang làm theo hướng dẫn trong "Mô hình dự đoán ứng dụng". Vì vậy, tôi đã lọc các tính năng tương quan và kết thúc với các điều sau đây: 4900 điểm dữ liệu trong tập huấn luyện và 1600 điểm dữ …

2
Bằng chứng về sự hội tụ của phương tiện k
Đối với một nhiệm vụ tôi đã được yêu cầu cung cấp một bằng chứng rằng k-mean hội tụ trong một số bước hữu hạn. Đây là những gì tôi đã viết: CCCE(C)=∑xmini=1k∥x−ci∥2E(C)=∑xmini=1k‖x−ci‖2E(C)=\sum_{\mathbf{x}}\min_{i=1}^{k}\left\Vert \mathbf{x}-\mathbf{c}_{i}\right\Vert ^{2}E(C)E(C)E(C) Bước 2 đề cập đến bước gắn nhãn từng điểm dữ liệu theo trung tâm …






Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.