Thống kê và dữ liệu lớn

Q & A cho những người quan tâm đến thống kê, học máy, phân tích dữ liệu, khai thác dữ liệu và trực quan hóa dữ liệu


1
IDF tăng dần (Tần số tài liệu nghịch đảo)
Trong một ứng dụng khai thác văn bản, một cách tiếp cận đơn giản là sử dụng heuristic để tạo các vectơ như các biểu diễn thưa thớt nhỏ gọn của các tài liệu. Điều này tốt cho cài đặt hàng loạt, trong đó toàn bộ kho được biết đến …

1
Giá trị trung bình và phương sai của phân phối Poisson bằng 0
Bất cứ ai cũng có thể chỉ ra giá trị và phương sai dự kiến ​​của Poisson bằng 0, với hàm khối lượng xác suất f(y)={π+(1−π)e−λ,(1−π)λye−λy!,if y=0if y=1,2....f(y)={π+(1−π)e−λ,if y=0(1−π)λye−λy!,if y=1,2.... f(y) = \begin{cases} \pi+(1-\pi)e^{-\lambda}, & \text{if }y=0 \\ (1-\pi)\frac{\lambda^{y}e^{-\lambda}}{y!}, & \text{if }y=1,2.... \end{cases} Trong đó là xác suất quan sát …

3
Mô hình phân loại để dự đoán xếp hạng phim
Tôi hơi mới đối với việc khai thác dữ liệu và tôi đang nghiên cứu một mô hình phân loại để dự đoán xếp hạng phim. Tôi đã thu thập các tập dữ liệu từ IMDB và tôi đang dự định sử dụng cây quyết định và các phương pháp …










2
Tôi có nên chạy hồi quy riêng cho mọi cộng đồng hay cộng đồng có thể đơn giản là biến kiểm soát trong mô hình tổng hợp không?
Tôi đang chạy một mô hình OLS với biến chỉ số tài sản liên tục là DV. Dữ liệu của tôi được tổng hợp từ ba cộng đồng tương tự gần nhau về mặt địa lý. Mặc dù vậy, tôi nghĩ điều quan trọng là sử dụng cộng đồng như …

8
Nghịch lý tù nhân
Tôi được cho một bài tập, và tôi không thể tìm ra nó. Nghịch lý tù nhânBa tù nhân bị biệt giam, A, B và C, đã bị kết án tử hình trong cùng một ngày, nhưng vì có một ngày lễ quốc gia, thống đốc quyết định rằng một …

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.