Thống kê và dữ liệu lớn

Q & A cho những người quan tâm đến thống kê, học máy, phân tích dữ liệu, khai thác dữ liệu và trực quan hóa dữ liệu

5
Về tầm quan trọng của giả định iid trong học tập thống kê
Trong học tập thống kê, ngầm hay rõ ràng, một luôn luôn giả định rằng các tập huấn luyện gồm tuples đầu vào / response được rút ra độc lập từ cùng một phân phối chung vớiD={X,y}D={X,y}\mathcal{D} = \{ \bf {X}, \bf{y} \}NNNP ( X , y )(Xi,yi)(Xi,yi)({\bf{X}}_i,y_i) P(X,y)P(X,y)\mathbb{P}({\bf{X}},y) p(X,y)=p(y|X)p(X)p(X,y)=p(y|X)p(X) …




10
Học máy bằng Python
Tôi đang xem xét sử dụng các thư viện Python để thực hiện các thí nghiệm Machine Learning của mình. Cho đến nay, tôi đã dựa vào WEKA, nhưng đã không hài lòng về tổng thể. Điều này chủ yếu là vì tôi thấy WEKA không được hỗ trợ tốt …










3
Tại sao chúng ta quan tâm rất nhiều về các thuật ngữ lỗi được phân phối thông thường (và homoskedasticity) trong hồi quy tuyến tính khi chúng ta không phải làm vậy?
Tôi cho rằng tôi cảm thấy thất vọng mỗi khi nghe ai đó nói rằng sự không bình thường của phần dư và / hoặc tính không đồng nhất vi phạm các giả định OLS. Để ước tính các tham số trong mô hình OLS, cả hai giả định này …

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.