Thống kê và dữ liệu lớn

Q & A cho những người quan tâm đến thống kê, học máy, phân tích dữ liệu, khai thác dữ liệu và trực quan hóa dữ liệu


2
Ảnh hưởng còn lại so với ngoại lệ
Đầu tiên, tôi nên nói rằng tôi đã tìm kiếm trên trang web này để tìm câu trả lời. Tôi không tìm thấy câu hỏi nào trả lời câu hỏi của mình hoặc trình độ hiểu biết của tôi quá thấp Tôi không nhận ra mình đã đọc câu trả …

1
Làm thế nào để tính toán thông tin lẫn nhau?
Tôi la một chut Nhâm lân. Ai đó có thể giải thích cho tôi cách tính thông tin lẫn nhau giữa hai thuật ngữ dựa trên ma trận tài liệu thuật ngữ với sự xuất hiện của thuật ngữ nhị phân là trọng số không? Document1Document2Document3′Why′111′How′101′When′111′Where′100′Why′′How′′When′′Where′Document11111Document21010Document31110 \begin{matrix} & 'Why' & …


2
Giá trị mong đợi của biến ngẫu nhiên Gaussian được chuyển đổi bằng hàm logistic
Cả hàm logistic và độ lệch chuẩn thường được ký hiệu là . Tôi sẽ sử dụng và cho độ lệch chuẩn.σσ\sigmaσ(x)=1/(1+exp(−x))σ(x)=1/(1+exp⁡(−x))\sigma(x) = 1/(1+\exp(-x))sss Tôi có một neuron hậu cần với một đầu vào ngẫu nhiên mà có nghĩa là và độ lệch chuẩn tôi biết. Tôi hy vọng sự …






1
Phân phối dài các sự kiện thời gian
Giả sử bạn có nhật ký của một máy chủ web. Trong các bản ghi này, bạn có bộ dữ liệu loại này: user1, timestamp1 user1, timestamp2 user1, timestamp3 user2, timestamp4 user1, timestamp5 ... Những dấu thời gian này đại diện cho các nhấp chuột của người dùng. Bây giờ, …


3
Chọn số lượng thành phần chính để giữ lại
Một phương pháp được đề xuất với tôi là xem xét một âm mưu và kiểm tra "khuỷu tay" để xác định số lượng PC chính xác sẽ sử dụng. Nhưng nếu cốt truyện không rõ ràng, R có tính toán để xác định số không? fit <- princomp(mydata, cor=TRUE)
10 r  pca 



Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.