Thống kê và dữ liệu lớn

Q & A cho những người quan tâm đến thống kê, học máy, phân tích dữ liệu, khai thác dữ liệu và trực quan hóa dữ liệu


1
Làm thế nào để giải thích tải PCA?
Trong khi đọc về PCA, tôi đã xem qua lời giải thích sau: Giả sử chúng ta có một bộ dữ liệu trong đó mỗi điểm dữ liệu đại diện cho điểm của một học sinh trong bài kiểm tra toán, bài kiểm tra vật lý, bài kiểm tra đọc …
13 pca 







1
Tại sao sai số chuẩn của phần chặn tăng thêm
Sai số chuẩn của thuật ngữ đánh chặn ( β 0 ) trong y = β 1 x + β 0 + ε được cho bởi S E ( β 0 ) 2 = σ 2 [ 1β^0β^0\hat{\beta}_0y=β1x+β0+εy=β1x+β0+εy=\beta_1x+\beta_0+\varepsilon trong đóˉxlà giá trị trung bình củaxi's.SE(β^0)2=σ2[1n+x¯2∑ni=1(xi−x¯)2]SE(β^0)2=σ2[1n+x¯2∑i=1n(xi−x¯)2]SE(\hat{\beta}_0)^2 = \sigma^2\left[\frac{1}{n}+\frac{\bar{x}^2}{\sum_{i=1}^n(x_i-\bar{x})^2}\right]x¯x¯\bar{x}xixix_i Từ những gì …

1
Một thói quen để chọn eps và minPts cho DBSCAN
DBSCAN là thuật toán phân cụm được trích dẫn nhiều nhất theo một số tài liệu và nó có thể tìm thấy các cụm hình dạng tùy ý dựa trên mật độ. Nó có hai tham số eps (như bán kính lân cận) và minPts (như các lân cận tối …

3
Chuyển đổi phân phối cực kỳ sai lệch
Giả sử rằng tôi có một biến có phân phối bị lệch dương ở mức độ rất cao, như vậy việc lấy nhật ký sẽ không đủ để đưa nó vào trong phạm vi sai lệch cho phân phối bình thường. Lựa chọn của tôi tại thời điểm này là …




1
Sử dụng MLE so với OLS
Khi nào nên sử dụng Ước tính khả năng tối đa thay vì bình phương tối thiểu thông thường? Những điểm mạnh và hạn chế của mỗi là gì? Tôi đang cố gắng thu thập kiến ​​thức thực tế về nơi sử dụng mỗi trong các tình huống phổ biến.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.