Thống kê và dữ liệu lớn

Q & A cho những người quan tâm đến thống kê, học máy, phân tích dữ liệu, khai thác dữ liệu và trực quan hóa dữ liệu


1
Kích thước cây trong tăng cường cây dốc
Tăng cường cây Gradient theo đề xuất của Friedman sử dụng các cây quyết định với Jcác nút cuối (= lá) làm người học cơ sở. Có một số cách để trồng cây với Jcác nút chính xác, ví dụ, người ta có thể trồng cây theo chiều sâu đầu …
10 r  cart  boosting 


3
Tại sao một người sử dụng bình phương tuổi như một đồng biến trong một nghiên cứu kết hợp di truyền?
Tại sao một người sử dụng tuổi và bình phương tuổi như là đồng biến trong một nghiên cứu liên kết di truyền? Tôi có thể hiểu việc sử dụng tuổi nếu nó được xác định là đồng biến quan trọng, nhưng tôi không biết gì về việc sử dụng …






3
Thống kê cho các trang web hẹn hò trực tuyến
Tôi tò mò làm thế nào một hệ thống hẹn hò trực tuyến có thể sử dụng dữ liệu khảo sát để xác định kết quả khớp. Giả sử họ có dữ liệu kết quả từ các trận đấu trong quá khứ (ví dụ: 1 = kết hôn hạnh phúc, …


1
Phân phối sự khác biệt của hai biến thống nhất độc lập, bị cắt ở 0
Đặt và là hai biến ngẫu nhiên độc lập có cùng phân bố với mật độXXXYYYU(0,1)U(0,1)U(0,1) f(x)=1f(x)=1f(x)=1 nếu (và ở nơi khác).0≤x≤10≤x≤10≤x≤1000 Đặt là biến ngẫu nhiên thực được xác định bởi:ZZZ Z=X−YZ=X−YZ=X-Y nếu (và ở nơi khác).X>YX>YX>Y000 Rút ra sự phân bố của .ZZZ Tính toán kỳ vọng và …



3
Làm thế nào để phân cụm các biến dọc?
Tôi có một loạt các biến chứa dữ liệu theo chiều dọc từ ngày 0 đến ngày 7. Tôi đang tìm kiếm một cách tiếp cận phân cụm thích hợp có thể phân cụm các biến dọc này (không phải trường hợp) thành các nhóm khác nhau. Tôi đã cố …
10 clustering 

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.