Thống kê và dữ liệu lớn

Q & A cho những người quan tâm đến thống kê, học máy, phân tích dữ liệu, khai thác dữ liệu và trực quan hóa dữ liệu




2
Các ứng dụng thực tế đã biết, hiện có của lý thuyết hỗn loạn trong khai thác dữ liệu là gì?
Trong khi tình cờ đọc một số thị trường đại chúng hoạt động trên lý thuyết hỗn loạn trong vài năm qua, tôi bắt đầu tự hỏi làm thế nào các khía cạnh khác nhau của nó có thể được áp dụng cho khai thác dữ liệu và các lĩnh …



1
Phân rã phương sai
Trong phần 3.2 của Nhận dạng mẫu và học máy của Giám mục , ông đã thảo luận về phân rã phương sai thiên vị, nói rằng đối với hàm mất bình phương, tổn thất dự kiến ​​có thể được phân tách thành một thuật ngữ sai lệch bình phương …

1
Đánh giá rừng ngẫu nhiên: OOB vs CV
Khi chúng tôi đánh giá chất lượng của Rừng ngẫu nhiên, ví dụ như sử dụng AUC, liệu có phù hợp hơn để tính các đại lượng này qua các Mẫu ngoài túi hoặc qua bộ xác nhận chéo không? Tôi nghe rằng việc tính toán nó qua các Mẫu …






1
Định lý Bayes với nhiều điều kiện
Tôi không hiểu làm thế nào phương trình này được bắt nguồn. P(I|M1∩M2)≤P(I)P(I′)⋅P(M1|I)P(M2|I)P(M1|I′)P(M2|I′)P(I|M1∩M2)≤P(I)P(I′)⋅P(M1|I)P(M2|I)P(M1|I′)P(M2|I′)P(I|M_{1}\cap M_{2}) \leq \frac{P(I)}{P(I')}\cdot \frac{P(M_{1}|I)P(M_{2}|I)}{P(M_{1}|I')P(M_{2}|I')} Phương trình này được lấy từ bài báo "Thử nghiệm theo Xác suất" trong đó trường hợp của OJ Simpson được đưa ra như một vấn đề mẫu. Bị cáo đang bị xét …


Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.