Thống kê và dữ liệu lớn

Q & A cho những người quan tâm đến thống kê, học máy, phân tích dữ liệu, khai thác dữ liệu và trực quan hóa dữ liệu

7
Trong Naive Bayes, tại sao phải bận tâm với việc làm mịn Laplace khi chúng ta có những từ chưa biết trong bộ thử nghiệm?
Tôi đã đọc qua Phân loại Naive Bayes ngày hôm nay. Tôi đọc, dưới tiêu đề Ước tính tham số với thêm 1 làm mịn : Hãy để ccc tham khảo một lớp (chẳng hạn như Tích cực hoặc Tiêu cực) và để www tham khảo mã thông báo hoặc …

3
Phân phối các sản phẩm vô hướng của hai vectơ đơn vị ngẫu nhiên theo kích thước
Nếu xx\mathbf{x} và yy\mathbf{y} là hai vectơ đơn vị ngẫu nhiên độc lập trong RDRD\mathbb{R}^D (phân bố đồng đều trên một mặt cầu đơn vị), thì phân phối của sản phẩm vô hướng của chúng (sản phẩm chấm) x⋅yx⋅y\mathbf x \cdot \mathbf y gì? DDDlimD→∞σ2(D)→0,limD→∞σ2(D)→0,\lim_{D\to\infty}\sigma^2(D) \to 0,σ2(D)σ2(D)\sigma^2(D) Cập nhật Tôi …

4
Phát hiện các ngoại lệ bằng độ lệch chuẩn
Theo câu hỏi của tôi ở đây , tôi tự hỏi liệu có quan điểm mạnh đối với việc chống lại việc sử dụng độ lệch chuẩn để phát hiện các ngoại lệ hay không (ví dụ: bất kỳ dữ liệu nào có nhiều hơn 2 độ lệch chuẩn là …
27 outliers 




3
Làm trắng da luôn tốt?
Một bước tiền xử lý phổ biến cho các thuật toán học máy là làm trắng dữ liệu. Có vẻ như nó luôn luôn tốt để làm trắng vì nó không tương quan dữ liệu, làm cho nó đơn giản hơn để mô hình hóa. Khi nào nên tẩy trắng …









Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.