Thống kê và dữ liệu lớn

Q & A cho những người quan tâm đến thống kê, học máy, phân tích dữ liệu, khai thác dữ liệu và trực quan hóa dữ liệu


2
Làm cách nào để bao gồm một thuật ngữ tương tác trong GAM?
Đoạn mã sau đánh giá sự giống nhau giữa hai chuỗi thời gian: set.seed(10) RandData <- rnorm(8760*2) America <- rep(c('NewYork','Miami'),each=8760) Date = seq(from=as.POSIXct("1991-01-01 00:00"), to=as.POSIXct("1991-12-31 23:00"), length=8760) DatNew <- data.frame(Loc = America, Doy = as.numeric(format(Date,format = "%j")), Tod = as.numeric(format(Date,format = "%H")), Temp = RandData, DecTime = rep(seq(1, length(RandData)/2) / …


3
Tương quan giữa hai chuỗi thời gian
Cách / phương pháp dễ nhất để tính toán mối tương quan giữa hai chuỗi thời gian có cùng kích thước là gì? Tôi nghĩ đến việc nhân và ( y [ t ] - μ y ) , và thêm lên nhân. Vì vậy, nếu con số duy nhất …

1
Ai đã phát minh ra xác nhận chéo k-Fold?
Tôi đang tìm kiếm một tài liệu tham khảo cho bài báo nơi xác nhận chéo k-gấp được giới thiệu (thay vì chỉ là một tài liệu tham khảo học thuật tốt cho chủ đề này). Có lẽ đã quá xa trong thời gian để xác định rõ ràng tờ …










7
Thuật toán theo dõi động lượng tử
Tôi muốn ước tính số lượng của một số dữ liệu. Dữ liệu quá lớn đến nỗi chúng không thể chứa trong bộ nhớ. Và dữ liệu không tĩnh, dữ liệu mới tiếp tục đến. Có ai biết bất kỳ thuật toán nào để theo dõi lượng tử của dữ …

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.