Thống kê và dữ liệu lớn

Q & A cho những người quan tâm đến thống kê, học máy, phân tích dữ liệu, khai thác dữ liệu và trực quan hóa dữ liệu

3
Số ngẫu nhiên - Set.seed (N) trong R [trùng lặp]
Câu hỏi này đã có câu trả lời ở đây: Chính xác thì hạt giống trong một trình tạo số ngẫu nhiên là gì? 3 câu trả lời Tôi nhận ra rằng người ta sử dụng set.seed()trong R để tạo số giả ngẫu nhiên. Tôi cũng nhận ra rằng sử …

3
Liệu dấu hiệu của điểm số hoặc tải trong PCA hoặc FA có ý nghĩa? Tôi có thể đảo ngược các dấu hiệu?
Tôi đã thực hiện phân tích thành phần chính (PCA) với R bằng hai hàm khác nhau ( prcompvà princomp) và nhận thấy rằng điểm PCA khác nhau về dấu hiệu. Làm thế nào nó có thể được? Xem xét điều này: set.seed(999) prcomp(data.frame(1:10,rnorm(10)))$x PC1 PC2 [1,] -4.508620 -0.2567655 [2,] …
37 r  pca  factor-analysis 


3
Phương sai của hệ số hồi quy trong hồi quy tuyến tính đơn giản
Trong hồi quy tuyến tính đơn giản, chúng ta có , trong đó . Tôi đã lấy công cụ ước tính: trong đó và là phương tiện mẫu của và .y=β0+β1x+uy=β0+β1x+uy = \beta_0 + \beta_1 x + uu∼iidN(0,σ2)u∼iidN(0,σ2)u \sim iid\;\mathcal N(0,\sigma^2)β1^=∑i(xi−x¯)(yi−y¯)∑i(xi−x¯)2 ,β1^=∑i(xi−x¯)(yi−y¯)∑i(xi−x¯)2 , \hat{\beta_1} = \frac{\sum_i (x_i - \bar{x})(y_i - …



5
Phân tích chuỗi thời gian xác thực chéo
Tôi đã sử dụng gói caret trong R để xây dựng các mô hình dự đoán để phân loại và hồi quy. Caret cung cấp một giao diện hợp nhất để điều chỉnh các tham số siêu mô hình bằng cách xác thực chéo hoặc đóng đai khởi động. Ví …









Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.