Thống kê và dữ liệu lớn

Q & A cho những người quan tâm đến thống kê, học máy, phân tích dữ liệu, khai thác dữ liệu và trực quan hóa dữ liệu



5
LDA vs word2vec
Tôi đang cố gắng hiểu thế nào là tương đồng giữa Phân bổ Dirichlet tiềm ẩn và word2vec để tính độ tương tự từ. Theo tôi hiểu, LDA ánh xạ các từ thành một vectơ xác suất của các chủ đề tiềm ẩn , trong khi word2vec ánh xạ chúng …



3
Là tiêu chuẩn hóa cần thiết trước khi hồi quy logistic phù hợp?
Câu hỏi của tôi là chúng ta có cần chuẩn hóa tập dữ liệu để đảm bảo tất cả các biến có cùng tỷ lệ, giữa [0,1], trước khi điều chỉnh hồi quy logistic. Công thức là: xi−min(xi)max(xi)−min(xi)xi−min(xi)max(xi)−min(xi)\frac{x_i-\min(x_i)}{\max(x_i)-\min(x_i)} Tập dữ liệu của tôi có 2 biến, chúng mô tả cùng …

1
Xếp hạng theo thứ tự R - giảm dần [đóng]
Tôi đang tìm cách xếp hạng dữ liệu, trong một số trường hợp, giá trị lớn hơn có thứ hạng 1. Tôi tương đối mới với R, nhưng tôi không thấy cách tôi có thể điều chỉnh cài đặt này trong chức năng xếp hạng. x <- c(23,45,12,67,34,89) rank(x) tạo …
39 r 






3
Tại sao Cây quyết định không đắt tiền tính toán?
Trong phần Giới thiệu về Học thống kê với các ứng dụng trong R , các tác giả viết rằng việc điều chỉnh cây quyết định là rất nhanh, nhưng điều này không có ý nghĩa với tôi. Thuật toán phải đi qua mọi tính năng và phân vùng nó …
38 cart 



Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.