Thống kê và dữ liệu lớn

Q & A cho những người quan tâm đến thống kê, học máy, phân tích dữ liệu, khai thác dữ liệu và trực quan hóa dữ liệu

4
GEE: chọn cấu trúc tương quan làm việc phù hợp
Tôi là một nhà dịch tễ học cố gắng tìm hiểu GEE để phân tích chính xác một nghiên cứu đoàn hệ (sử dụng hồi quy Poisson với một liên kết nhật ký, để ước tính Rủi ro tương đối). Tôi có một vài câu hỏi về "mối tương quan …
19 gee 


2
Là một
Tôi đã ước tính một mô hình tuyến tính mạnh mẽ Rvới trọng số MM bằng cách sử dụng rlm()gói MASS. `R`` không cung cấp giá trị cho mô hình, nhưng tôi muốn có một giá trị nếu đó là một đại lượng có ý nghĩa. Tôi cũng muốn biết …



1
Caret và hệ số (glmnet)
Tôi quan tâm đến việc sử dụng dấu mũ để suy luận về một tập dữ liệu cụ thể. Có thể làm như sau: tạo ra các hệ số của mô hình glmnet tôi được đào tạo về caret. Tôi muốn sử dụng glmnet vì lựa chọn tính năng vốn …
19 caret  glmnet 


2
Rừng ngẫu nhiên là quá mức?
Tôi đang thử nghiệm các khu rừng ngẫu nhiên với scikit-learn và tôi đang nhận được kết quả tuyệt vời của bộ huấn luyện của mình, nhưng kết quả tương đối kém trong bộ thử nghiệm của tôi ... Đây là vấn đề (lấy cảm hứng từ bài xì phé) …

4
Vấn đề với bằng chứng về kỳ vọng có điều kiện là dự đoán tốt nhất
Tôi có một vấn đề với bằng chứng về E(Y|X)∈argming(X)E[(Y−g(X))2]E(Y|X)∈arg⁡ming(X)E[(Y−g(X))2]E(Y|X) \in \arg \min_{g(X)} E\Big[\big(Y - g(X)\big)^2\Big] mà rất có thể tiết lộ một sự hiểu lầm sâu sắc hơn về kỳ vọng và kỳ vọng có điều kiện. Bằng chứng tôi biết diễn ra như sau (phiên bản khác của …







Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.