Thống kê và dữ liệu lớn

Q & A cho những người quan tâm đến thống kê, học máy, phân tích dữ liệu, khai thác dữ liệu và trực quan hóa dữ liệu




3
Ước lượng không thiên vị của ma trận hiệp phương sai cho dữ liệu bị kiểm duyệt nhân
Các phân tích hóa học của các mẫu môi trường thường được kiểm duyệt dưới đây ở các giới hạn báo cáo hoặc các giới hạn phát hiện / định lượng khác nhau. Cái sau có thể thay đổi, thường là tỷ lệ với các giá trị của các biến …


9
Làm cách nào để tìm ra loại phân phối nào thể hiện dữ liệu này theo thời gian phản hồi ping?
Tôi đã lấy mẫu một quy trình trong thế giới thực, thời gian ping mạng. "Chuyến đi khứ hồi" được tính bằng mili giây. Kết quả được vẽ trong một biểu đồ: Thời gian Ping có giá trị tối thiểu, nhưng đuôi trên dài. Tôi muốn biết phân phối thống …





3
Phân loại / số liệu đánh giá cho dữ liệu mất cân bằng cao
Tôi xử lý vấn đề phát hiện gian lận (giống như điểm tín dụng). Như vậy, có một mối quan hệ rất mất cân bằng giữa các quan sát gian lận và không gian lận. http://blog.revolutionanalytics.com/2016/03/com_group_eval_metrics_r.html cung cấp một cái nhìn tổng quan tuyệt vời về các số liệu phân …



6
Khả năng - Tại sao nhân lên?
Tôi đang nghiên cứu về ước tính khả năng tối đa và tôi đọc rằng hàm khả năng là sản phẩm của xác suất của mỗi biến. Tại sao nó là sản phẩm? Tại sao không phải là tổng? Tôi đã cố gắng tìm kiếm trên Google nhưng tôi không …


Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.