Thống kê và dữ liệu lớn

Q & A cho những người quan tâm đến thống kê, học máy, phân tích dữ liệu, khai thác dữ liệu và trực quan hóa dữ liệu



1
L-BFGS hoạt động như thế nào?
Mục đích của bài viết là tối ưu hóa một số tham số bằng cách tối đa hóa khả năng đăng nhập thường xuyên. Sau đó, họ tính toán các dẫn xuất một phần. Và sau đó các tác giả đề cập rằng họ tối ưu hóa phương trình bằng …





1
Liệu một hồi quy logistic tối đa hóa khả năng cũng nhất thiết phải tối đa hóa AUC trên các mô hình tuyến tính?
Cho một tập dữ liệu với kết quả nhị phân y∈{0,1}ny∈{0,1}ny\in\{0,1\}^n và một số ma trận dự đoán X∈Rn×pX∈Rn×pX\in\mathbb{R}^{n\times p} , mô hình hồi quy logistic tiêu chuẩn ước tính các hệ số βMLEβMLE\beta_{MLE} để tối đa hóa khả năng nhị thức. Khi XXX đầy đủ thứ hạng βMLEβMLE\beta_{MLE} là …

1
Bỏ các ngoại lệ dựa trên Rô-bốt 2,5 lần RMSE '
Trong Kahneman và Deaton (2010) , các tác giả viết như sau:††^\dagger Hồi quy này giải thích 37% phương sai, với sai số bình phương trung bình gốc (RMSE) là 0,67852. Để loại bỏ các ngoại lệ và báo cáo thu nhập hợp lý, chúng tôi đã bỏ các quan …






8
Làm thế nào để điều trị trả lời khảo sát phi logic
Tôi đã gửi một cuộc khảo sát cho một mẫu của các nghệ sĩ. Một trong những câu hỏi là chỉ ra tỷ lệ phần trăm thu nhập có được từ: hoạt động nghệ thuật, hỗ trợ của chính phủ, lương hưu tư nhân, các hoạt động không liên quan …
13 survey  bias 

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.