Thống kê và dữ liệu lớn

Q & A cho những người quan tâm đến thống kê, học máy, phân tích dữ liệu, khai thác dữ liệu và trực quan hóa dữ liệu


1
Có một tập hợp rõ ràng các điều kiện theo đó các đường dẫn giải pháp lưới lasso, sườn núi hoặc lưới đàn hồi là đơn điệu không?
Câu hỏi Điều gì để kết luận từ cốt truyện Lasso này (glmnet) cho thấy các đường dẫn giải pháp cho công cụ ước tính Lasso không đơn điệu. Đó là, một số quan tài phát triển về giá trị tuyệt đối trước khi chúng co lại. Tôi đã áp …

2
Làm mịn - khi nào nên sử dụng và khi nào không?
Có một bài viết cũ trên blog của William Briggs , xem xét những cạm bẫy của việc làm mịn dữ liệu và mang dữ liệu được làm mịn đó để phân tích. Đối số chính là: Nếu trong một khoảnh khắc điên rồ, bạn thực hiện dữ liệu chuỗi …

1
Bằng chứng về công thức LOOCV
Từ Giới thiệu về Học thống kê của James và cộng sự, ước tính xác thực chéo một lần (LOOCV) được xác định bởi CV(n)=1n∑i=1nMSEiCV(n)=1n∑i=1nMSEi\text{CV}_{(n)} = \dfrac{1}{n}\sum\limits_{i=1}^{n}\text{MSE}_i nơiMSEi=(yi−y^i)2MSEi=(yi−y^i)2\text{MSE}_i = (y_i-\hat{y}_i)^2. Không có bằng chứng, phương trình (5.2) nói rằng đối với hồi quy bình phương nhỏ nhất hoặc đa thức …



1
Định vị các mũi tên trên biplot PCA
Tôi đang tìm cách triển khai một biplot để phân tích thành phần chính (PCA) trong JavaScript. Câu hỏi của tôi là, làm thế nào để tôi xác định tọa độ của các mũi tên từ đầu ra của phân tách vectơ số ít (SVD) của ma trận dữ liệu?Bạn, …
18 pca  svd  biplot 


1
Ý nghĩa ngôn ngữ đơn giản của các bài kiểm tra độc lập và phụ thuộc vào những người khác
Trong cả tài liệu về tỷ lệ lỗi thông minh của gia đình (FWER) và tỷ lệ phát hiện sai (FDR), các phương pháp kiểm soát FWER hoặc FDR cụ thể được cho là phù hợp với các thử nghiệm phụ thuộc hoặc độc lập. Ví dụ, trong bài báo …



3
Trong bài kiểm tra chính xác của Fisher: Thử nghiệm nào sẽ phù hợp nếu người phụ nữ không biết số cốc sữa đầu tiên?
Trong thí nghiệm nếm trà của người phụ nữ nổi tiếng của RA Fisher, người phụ nữ được thông báo về việc có bao nhiêu cốc sữa đầu tiên / tách trà đầu tiên (4 cho mỗi trong số 8 cốc). Điều này tôn trọng tổng giả định biên cố …


1
Sử dụng bootstrap dưới H0 để thực hiện kiểm tra sự khác biệt của hai phương tiện: thay thế trong các nhóm hoặc trong mẫu gộp
Giả sử rằng tôi có dữ liệu với hai nhóm độc lập: g1.lengths <- c (112.64, 97.10, 84.18, 106.96, 98.42, 101.66) g2.lengths <- c (84.44, 82.10, 83.26, 81.02, 81.86, 86.80, 85.84, 97.08, 79.64, 83.32, 91.04, 85.92, 73.52, 85.58, 97.70, 89.72, 88.92, 103.72, 105.02, 99.48, 89.50, 81.74) group = rep (c …


Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.