Thống kê và dữ liệu lớn

Q & A cho những người quan tâm đến thống kê, học máy, phân tích dữ liệu, khai thác dữ liệu và trực quan hóa dữ liệu

1
Định mức nào của lỗi tái cấu trúc được giảm thiểu bằng ma trận xấp xỉ bậc thấp thu được với PCA?
Cho một PCA (hoặc SVD) xấp xỉ của ma trận với một ma trận , chúng ta biết rằng là xấp xỉ hạng thấp nhất của .X X XXXXX^X^\hat XX^X^\hat XXXX Đây có phải là theo gây chuẩn∥⋅∥2∥⋅∥2\parallel \cdot \parallel_2 ∥ ⋅ ∥ F (tức là tiêu chuẩn eigenvalue lớn …


1
One-vs-All và One-vs-One trong svm?
Sự khác biệt giữa trình phân loại SVM một đấu một và một đấu một là gì? Liệu một phân loại có nghĩa là một phân loại để phân loại tất cả các loại / loại của hình ảnh mới và một so với một có nghĩa là mỗi loại …


7
Kiểm tra giả thuyết phân phối - quan điểm của việc thực hiện là gì nếu bạn không thể chấp nhận Giả thuyết khống của bạn?
Các thử nghiệm giả thuyết khác nhau, chẳng hạn như thử nghiệm GOF, Kolmogorov-Smirnov, Anderson-Darling, v.v., tuân theo định dạng cơ bản này:χ2χ2\chi^{2} H0H0H_0 : Dữ liệu tuân theo phân phối đã cho. H1H1H_1 : Dữ liệu không tuân theo phân phối đã cho. Thông thường, người ta đánh giá …



2
Tại sao LDA của Scikit-learn LDA không hoạt động chính xác và làm thế nào để tính toán LDA qua SVD?
Tôi đã sử dụng Phân tích phân biệt tuyến tính (LDA) từ scikit-learnthư viện máy học (Python) để giảm kích thước và có một chút tò mò về kết quả. Bây giờ tôi đang tự hỏi LDA scikit-learnđang làm gì để kết quả trông khác với, ví dụ, cách tiếp …





2
Ước tính lượng tử giá trị trong một vectơ
Tôi có một bộ số thực. Tôi cần ước tính số lượng của một số mới. Có cách nào sạch để làm điều này trong R không? nói chung? Tôi hy vọng điều này không phải là quá nhỏ ;-) Rất nhiều đánh giá cao cho phản ứng của bạn. …
26 r 


3
Làm thế nào là tìm trung tâm khác với tìm trung bình?
Khi thực hiện phân cụm theo cấp bậc, người ta có thể sử dụng nhiều số liệu để đo khoảng cách giữa các cụm. Hai số liệu như vậy ngụ ý tính toán trọng tâm và phương tiện của các điểm dữ liệu trong các cụm. Sự khác biệt giữa …
26 clustering  mean 

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.