Thống kê và dữ liệu lớn

1

Pdf của bình phương của một biến ngẫu nhiên tiêu chuẩn thông thường [đóng]

Đã đóng cửa. Câu hỏi này không đúng chủ đề . Nó hiện không chấp nhận câu trả lời. Bạn muốn cải thiện câu hỏi này? Cập nhật câu hỏi để nó thuộc chủ đề cho Xác thực chéo. Đóng cửa 4 năm trước . Tôi có vấn đề này …

12 self-study distributions normal-distribution pdf

2

Các định nghĩa AIC khác nhau

Từ Wikipedia có định nghĩa về Tiêu chí Thông tin (AIC) của Akaike là AIC=2k−2logLAIC=2k−2log⁡L AIC = 2k -2 \log L , trong đó kkk là số lượng tham số và là khả năng đăng nhập của mô hình.logLlog⁡L\log L Tuy nhiên, Kinh tế lượng của chúng tôi lưu ý …

12 econometrics aic arma information-theory

2

Kỳ vọng tối đa của biến iid Gumbel

Tôi tiếp tục đọc các tạp chí kinh tế về một kết quả cụ thể được sử dụng trong các mô hình tiện ích ngẫu nhiên. Một phiên bản của kết quả là: if ϵi∼iid,ϵi∼iid,\epsilon_i \sim_{iid}, Gumbel ( μ,1),∀iμ,1),∀i\mu, 1), \forall i , thì: E[maxi(δi+ϵi)]=μ+γ+ln(∑iexp{δi}),E[maxi(δi+ϵi)]=μ+γ+ln⁡(∑iexp⁡{δi}),E[\max_i(\delta_i + \epsilon_i)] = \mu + …

12 expected-value gumbel

2

Ma trận hiệp phương sai điều hòa trong hồi quy GP để tối ưu hóa Bayes

Bối cảnh và vấn đề Tôi đang sử dụng Gaussian Processes (GP) để hồi quy và tối ưu hóa Bayes (BO) tiếp theo. Để hồi quy tôi sử dụng gói gpml cho MATLAB với một số sửa đổi tùy chỉnh, nhưng vấn đề là chung. Một thực tế nổi tiếng …

12 regression covariance-matrix gaussian-process bayesian-optimization

2

Tổng điểm đánh giá so với điểm yếu tố ước tính?

Tôi rất muốn nhận được đề xuất về thời điểm sử dụng " điểm yếu tố " so với tổng điểm đơn giản khi xây dựng thang đo. Tức là "Tinh chỉnh" hơn các phương pháp "không tinh chế" để ghi một yếu tố. Từ DiStefano et al. (2009; pdf …

12 factor-analysis sem scales

3

Tại sao điều quan trọng là phải phân biệt giữa hồi quy tuyến tính và so với hồi quy không tuyến tính?

Tầm quan trọng của sự khác biệt giữa các mô hình tuyến tính và phi tuyến tính là gì? Câu hỏi Mô hình tuyến tính phi tuyến so với tổng quát: Làm thế nào để bạn đề cập đến hồi quy logistic, Poisson, v.v. và câu trả lời của nó …

12 linear-model nonlinear-regression nonlinear

2

Định lý của Slutsky vẫn còn hiệu lực khi cả hai chuỗi đều hội tụ đến một biến ngẫu nhiên không suy biến?

Tôi bối rối về một số chi tiết về định lý của Slutsky : Đặt {Xn}{Xn}\{X_n\} , {Yn}{Yn}\{Y_n\} là hai chuỗi các phần tử ngẫu nhiên vô hướng / vectơ / ma trận. Nếu XnXnX_n hội tụ phân phối cho một phần tử ngẫu nhiên XXX và YnYnY_n hội tụ …

12 probability random-variable convergence slutsky-theorem

1

Phân phối xác suất đặc biệt

Nếu là phân phối xác suất có giá trị khác không trên , thì loại nào tồn tại hằng số sao cho với mọi ?p ( x ) p(x)p(x)[ 0 , + ∞ ) [0,+∞)[0,+\infty)p ( x ) p(x)p(x)c > 0 c>0c\gt 0∫ ∞ 0 p ( x ) log …

12 probability stochastic-processes kullback-leibler probability-inequalities

2

Là quy tắc chung là điều kiện cần thiết để tổng các biến ngẫu nhiên bình thường là bình thường?

Trong các bình luận sau câu trả lời này của tôi cho một câu hỏi liên quan, Người dùng ssdecontrol và Glen_b đã hỏi liệu tính quy phạm chung của và có cần thiết để khẳng định tính quy tắc của tổng không? Tất nhiên, sự bình thường chung đó …

12 probability normal-distribution distributions bivariate multivariate-normal

1

Giá trị mong đợi của , hệ số xác định, theo giả thuyết null

Tôi tò mò về báo cáo kết quả thực hiện ở dưới cùng của trang đầu tiên trong văn bản này về điều chỉnhR2adjustedRadjusted2R^2_\mathrm{adjusted} R2adjusted=1−(1−R2)(n−1n−m−1).Radjusted2=1−(1−R2)(n−1n−m−1).R^2_\mathrm{adjusted} =1-(1-R^2)\left({\frac{n-1}{n-m-1}}\right). Văn bản nêu rõ: Logic của việc điều chỉnh như sau: trong hồi quy nhiều bình thường, một dự đoán ngẫu nhiên giải thích …

12 regression expected-value goodness-of-fit r-squared

2

Đạo hàm của một quá trình Gaussian

Tôi tin rằng đạo hàm của một quá trình Gaussian (GP) là một GP khác, và vì vậy tôi muốn biết liệu có các phương trình dạng đóng cho các phương trình dự đoán của đạo hàm của GP không? Cụ thể, tôi đang sử dụng hạt nhân hiệp phương …

12 stochastic-processes gaussian-process derivative

3

Tại sao softmax phân cấp tốt hơn cho các từ không thường xuyên, trong khi lấy mẫu âm tính tốt hơn cho các từ thường xuyên?

Tôi tự hỏi tại sao softmax phân cấp lại tốt hơn cho các từ không thường xuyên, trong khi lấy mẫu âm sẽ tốt hơn cho các từ thường xuyên, trong các mô hình CBOW và bỏ qua gram của word2vec. Tôi đã đọc khiếu nại trên https://code.google.com.vn/p/word2vec/ .

12 natural-language word2vec word-embeddings softmax

2

Làm thế nào để chọn chiều rộng thùng tối ưu trong khi hiệu chỉnh mô hình xác suất?

Bối cảnh: Có một số câu hỏi / câu trả lời tuyệt vời ở đây về cách hiệu chỉnh các mô hình dự đoán xác suất của kết quả xảy ra. Ví dụ Điểm Brier , và sự phân hủy của nó thành độ phân giải, độ không chắc chắn …

12 probability predictive-models binary-data calibration scoring-rules

1

Các hệ số giống hệt nhau được ước tính trong mô hình Poisson so với Quasi-Poisson

Trong mô hình hóa dữ liệu đếm yêu cầu trong môi trường bảo hiểm, tôi đã bắt đầu với Poisson nhưng sau đó nhận thấy sự quá mức. Một Quasi-Poisson được mô hình hóa tốt hơn mối quan hệ phương sai trung bình lớn hơn so với Poisson cơ bản, …

12 r count-data poisson-regression overdispersion quasi-likelihood

4

Manh mối cho thấy một vấn đề rất phù hợp với hồi quy tuyến tính

Tôi đang học hồi quy tuyến tính bằng cách sử dụng Giới thiệu về Phân tích hồi quy tuyến tính của Montgomery, Peck và Vining . Tôi muốn chọn một dự án phân tích dữ liệu. Tôi có suy nghĩ ngây thơ rằng hồi quy tuyến tính chỉ phù hợp …

12 regression data-transformation model linear regression-strategies