Thống kê và dữ liệu lớn

Q & A cho những người quan tâm đến thống kê, học máy, phân tích dữ liệu, khai thác dữ liệu và trực quan hóa dữ liệu



6
Làm thế nào tôi có thể phân tích chứng minh rằng việc chia ngẫu nhiên một số tiền dẫn đến phân phối theo cấp số nhân (ví dụ: thu nhập và sự giàu có)?
Trong bài viết hiện tại về KHOA HỌC, những điều sau đây đang được đề xuất: Giả sử bạn chia ngẫu nhiên 500 triệu thu nhập cho 10.000 người. Chỉ có một cách để cung cấp cho mọi người một phần bằng nhau, 50.000 chia sẻ. Vì vậy, nếu bạn …

6
Tại sao lại giải thích về vấn đề này.
Gần đây tôi đã biết về một nguyên tắc của lý luận xác suất được gọi là " giải thích đi " và tôi đang cố gắng nắm bắt một trực giác cho nó. Hãy để tôi thiết lập một kịch bản. Gọi là sự kiện xảy ra trận động …



4
Nơi nào
Một phiên bản rất đơn giản của định lý giới hạn trung tâm như dưới đây là Lindeberg mật Lévy CLT. Tôi không hiểu tại sao lại có ở phía bên tay trái. Và Lyapunov CLT nói nhưng tại sao không phải ? Có ai cho tôi biết những yếu …


5
Biện pháp nâng trong khai thác dữ liệu
Tôi đã tìm kiếm nhiều trang web để biết chính xác thang máy sẽ làm gì? Kết quả mà tôi thấy tất cả là về việc sử dụng nó trong các ứng dụng chứ không phải chính nó. Tôi biết về chức năng hỗ trợ và tự tin. Từ Wikipedia, …

2
Sự phân bố của tổng các biến thể không iid gaussian là gì?
Nếu được phân phối , được phân phối và , tôi biết rằng được phân phối nếu X và Y độc lập.XXXN(μX,σ2X)N(μX,σX2)N(\mu_X, \sigma^2_X)YYYN(μY,σ2Y)N(μY,σY2)N(\mu_Y, \sigma^2_Y)Z=X+YZ=X+YZ = X + YZZZN(μX+μY,σ2X+σ2Y)N(μX+μY,σX2+σY2)N(\mu_X + \mu_Y, \sigma^2_X + \sigma^2_Y) Nhưng điều gì sẽ xảy ra nếu X và Y không độc lập, tức là (X,Y)≈N((μXμY),(σ2XσX,YσX,Yσ2Y))(X,Y)≈N((μXμY),(σX2σX,YσX,YσY2))(X, Y) …



5
Các chức năng thời gian trong R [đã đóng]
Tôi muốn đo thời gian cần thiết để lặp lại hoạt động của một chức năng. Được replicate()và sử dụng vòng lặp for tương đương? Ví dụ: system.time(replicate(1000, f())); system.time(for(i in 1:1000){f()}); Đó là phương pháp ưa thích. Trong đầu ra của system.time(), sys+userthời gian CPU thực tế để chạy …
36 r 



Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.