Thống kê và dữ liệu lớn

Q & A cho những người quan tâm đến thống kê, học máy, phân tích dữ liệu, khai thác dữ liệu và trực quan hóa dữ liệu

2
Cảnh quan thống kê
Có ai đã viết một cuộc khảo sát ngắn về các cách tiếp cận khác nhau để thống kê? Đến một xấp xỉ đầu tiên, bạn có số liệu thống kê thường xuyên và Bayes. Nhưng khi bạn nhìn gần hơn, bạn cũng có những cách tiếp cận khác như …



8
Đo lường chất lượng cụm
Tôi có một thuật toán phân cụm (không phải k-nghĩa) với tham số đầu vào (số lượng cụm). Sau khi thực hiện phân cụm, tôi muốn có được một số đo định lượng về chất lượng của phân cụm này. Thuật toán phân cụm có một thuộc tính quan trọng. …
17 clustering 

7
Là trung bình công bằng hơn có nghĩa là?
Gần đây tôi đã đọc lời khuyên rằng bạn thường nên sử dụng trung bình không có nghĩa là để loại bỏ các ngoại lệ. Ví dụ: Bài viết sau http://www.amazon.com/Forensic-Science-Intributiontion-Sellectific-Investigative/product-reviews/1420064932/ có 16 đánh giá tại thời điểm này: review= c(5, 5, 5, 5, 5, 5, 5, 5, 5, 5, …
17 mean  median  average 


3
Phân tích thành phần chính trong trò chơi ngược về phía trước: có bao nhiêu phương sai của dữ liệu được giải thích bởi sự kết hợp tuyến tính nhất định của các biến?
Tôi đã thực hiện một bộ phận phân tích chính gồm sáu biến MộtMộtA , BBB , CCC , DDD , EEE và FFF . Nếu tôi hiểu chính xác, PC1 không được bảo vệ sẽ cho tôi biết tổ hợp tuyến tính nào của các biến này mô tả …

2
Phân tích Bayes không đối xứng trong R
Tôi đang tìm kiếm một hướng dẫn tốt về phân cụm dữ liệu trong Rviệc sử dụng quy trình dirichlet phân cấp (HDP) (một trong những phương pháp Bayesian không tham số gần đây và phổ biến). Có DPpackage(IMHO, toàn diện nhất trong tất cả những cái có sẵn) trong …



2
Nếu độ rộng hạt nhân thay đổi thường tốt cho hồi quy hạt nhân, tại sao chúng thường không tốt cho ước tính mật độ hạt nhân?
Câu hỏi này được nhắc nhở bằng cách thảo luận ở nơi khác . Hạt nhân biến thường được sử dụng trong hồi quy cục bộ. Ví dụ, hoàng thổ được sử dụng rộng rãi và hoạt động tốt như hồi quy mượt mà hơn và dựa trên một hạt …


6
R: tính tương quan theo nhóm
Đã khóa . Câu hỏi này và câu trả lời của nó bị khóa vì câu hỏi không có chủ đề nhưng có ý nghĩa lịch sử. Nó hiện không chấp nhận câu trả lời hoặc tương tác mới. Trong R, tôi có một khung dữ liệu bao gồm nhãn …
17 r  correlation 



Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.