Thống kê và dữ liệu lớn

Q & A cho những người quan tâm đến thống kê, học máy, phân tích dữ liệu, khai thác dữ liệu và trực quan hóa dữ liệu

1
Hồi quy: Biến đổi biến
Khi biến đổi các biến, bạn có phải sử dụng tất cả các biến đổi giống nhau không? Ví dụ: tôi có thể chọn và chọn các biến được chuyển đổi khác nhau, như trong: Đặt là tuổi, thời gian làm việc, thời gian cư trú và thu nhập.x1,x2,x3x1,x2,x3x_1,x_2,x_3 Y …

4
Những tài liệu tham khảo nào nên được trích dẫn để hỗ trợ sử dụng 30 như một cỡ mẫu đủ lớn?
Tôi đã đọc / nghe nhiều lần rằng kích thước mẫu của ít nhất 30 đơn vị được coi là "mẫu lớn" (giả định về tính quy tắc của phương tiện thường xấp xỉ do CLT, ...). Do đó, trong các thí nghiệm của tôi, tôi thường tạo ra các …









5
Điểm số của xu hướng khác với việc cộng các biến số trong hồi quy như thế nào và khi nào chúng được ưu tiên hơn sau này?
Tôi thừa nhận tôi tương đối mới với điểm số xu hướng và phân tích nguyên nhân. Một điều không rõ ràng đối với tôi khi là người mới đến là cách "cân bằng" sử dụng điểm số xu hướng khác biệt về mặt toán học với những gì xảy …

1
Softmax_cross_entropy_with_logits khác với softmax_cross_entropy_with_logits_v2 như thế nào?
Cụ thể, tôi cho rằng tôi tự hỏi về tuyên bố này: Các phiên bản chính trong tương lai của TensorFlow sẽ cho phép độ dốc chảy vào đầu vào nhãn trên backprop theo mặc định. Mà được hiển thị khi tôi sử dụng tf.nn.softmax_cross_entropy_with_logits. Trong cùng một thông điệp, …

6
Rừng ngẫu nhiên - Cách xử lý quá mức
Tôi có một nền tảng khoa học máy tính nhưng tôi đang cố gắng dạy cho mình khoa học dữ liệu bằng cách giải quyết các vấn đề trên internet. Tôi đã làm việc về vấn đề này trong vài tuần qua (khoảng 900 hàng và 10 tính năng). Ban …



Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.