Thống kê và dữ liệu lớn

Q & A cho những người quan tâm đến thống kê, học máy, phân tích dữ liệu, khai thác dữ liệu và trực quan hóa dữ liệu


2
Các định nghĩa AIC khác nhau
Từ Wikipedia có định nghĩa về Tiêu chí Thông tin (AIC) của Akaike là AIC=2k−2logLAIC=2k−2log⁡L AIC = 2k -2 \log L , trong đó kkk là số lượng tham số và là khả năng đăng nhập của mô hình.logLlog⁡L\log L Tuy nhiên, Kinh tế lượng của chúng tôi lưu ý …

2
Kỳ vọng tối đa của biến iid Gumbel
Tôi tiếp tục đọc các tạp chí kinh tế về một kết quả cụ thể được sử dụng trong các mô hình tiện ích ngẫu nhiên. Một phiên bản của kết quả là: if ϵi∼iid,ϵi∼iid,\epsilon_i \sim_{iid}, Gumbel ( μ,1),∀iμ,1),∀i\mu, 1), \forall i , thì: E[maxi(δi+ϵi)]=μ+γ+ln(∑iexp{δi}),E[maxi(δi+ϵi)]=μ+γ+ln⁡(∑iexp⁡{δi}),E[\max_i(\delta_i + \epsilon_i)] = \mu + …




2
Định lý của Slutsky vẫn còn hiệu lực khi cả hai chuỗi đều hội tụ đến một biến ngẫu nhiên không suy biến?
Tôi bối rối về một số chi tiết về định lý của Slutsky : Đặt {Xn}{Xn}\{X_n\} , {Yn}{Yn}\{Y_n\} là hai chuỗi các phần tử ngẫu nhiên vô hướng / vectơ / ma trận. Nếu XnXnX_n hội tụ phân phối cho một phần tử ngẫu nhiên XXX và YnYnY_n hội tụ …


2
Là quy tắc chung là điều kiện cần thiết để tổng các biến ngẫu nhiên bình thường là bình thường?
Trong các bình luận sau câu trả lời này của tôi cho một câu hỏi liên quan, Người dùng ssdecontrol và Glen_b đã hỏi liệu tính quy phạm chung của và có cần thiết để khẳng định tính quy tắc của tổng không? Tất nhiên, sự bình thường chung đó …

1
Giá trị mong đợi của , hệ số xác định, theo giả thuyết null
Tôi tò mò về báo cáo kết quả thực hiện ở dưới cùng của trang đầu tiên trong văn bản này về điều chỉnhR2adjustedRadjusted2R^2_\mathrm{adjusted} R2adjusted=1−(1−R2)(n−1n−m−1).Radjusted2=1−(1−R2)(n−1n−m−1).R^2_\mathrm{adjusted} =1-(1-R^2)\left({\frac{n-1}{n-m-1}}\right). Văn bản nêu rõ: Logic của việc điều chỉnh như sau: trong hồi quy nhiều bình thường, một dự đoán ngẫu nhiên giải thích …


3
Tại sao softmax phân cấp tốt hơn cho các từ không thường xuyên, trong khi lấy mẫu âm tính tốt hơn cho các từ thường xuyên?
Tôi tự hỏi tại sao softmax phân cấp lại tốt hơn cho các từ không thường xuyên, trong khi lấy mẫu âm sẽ tốt hơn cho các từ thường xuyên, trong các mô hình CBOW và bỏ qua gram của word2vec. Tôi đã đọc khiếu nại trên https://code.google.com.vn/p/word2vec/ .




Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.