Thống kê và dữ liệu lớn

Q & A cho những người quan tâm đến thống kê, học máy, phân tích dữ liệu, khai thác dữ liệu và trực quan hóa dữ liệu






1
Khi xây dựng mô hình hồi quy bằng cách sử dụng các bộ mô hình hóa / xác thực riêng biệt, nó có phù hợp với việc tuần hoàn lại dữ liệu xác nhận không?
Giả sử tôi đã phân chia 80/20 giữa các quan sát mô hình hóa / xác nhận. Tôi đã điều chỉnh mô hình cho tập dữ liệu mô hình hóa và tôi cảm thấy thoải mái với lỗi mà tôi thấy trên tập dữ liệu xác thực. Trước khi tôi …


1
Rừng ngẫu nhiên và dự đoán
Tôi đang cố gắng hiểu cách Random Forest hoạt động. Tôi có một nắm bắt về cách cây được xây dựng nhưng không thể hiểu làm thế nào Rừng ngẫu nhiên đưa ra dự đoán về mẫu túi. Bất cứ ai có thể cho tôi một lời giải thích đơn …




2
Khi nào Đăng nhập / Exp Biến của bạn khi sử dụng Mô hình rừng ngẫu nhiên?
Tôi đang thực hiện hồi quy bằng cách sử dụng Rừng ngẫu nhiên để dự đoán giá dựa trên một số thuộc tính. Mã được viết bằng Python bằng Scikit-learn. Làm thế nào để bạn quyết định xem bạn có nên chuyển đổi các biến của mình bằng cách sử …



1
Dự đoán về các mô hình hiệu ứng hỗn hợp: phải làm gì với các hiệu ứng ngẫu nhiên?
Hãy xem xét bộ dữ liệu giả thuyết này: set.seed(12345) num.subjects <- 10 dose <- rep(c(1,10,50,100), num.subjects) subject <- rep(1:num.subjects, each=4) group <- rep(1:2, each=num.subjects/2*4) response <- dose*dose/10 * group + rnorm(length(dose), 50, 30) df <- data.frame(dose=dose, response=response, subject=subject, group=group) chúng ta có thể sử dụng lmeđể mô hình hóa …

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.