Thống kê và dữ liệu lớn

Q & A cho những người quan tâm đến thống kê, học máy, phân tích dữ liệu, khai thác dữ liệu và trực quan hóa dữ liệu




2
Thống kê đầy đủ là gì?
Tôi có một số khó khăn để hiểu đầy đủ thống kê đầy đủ? Đặt là một thống kê đầy đủ.T=ΣxiT=ΣxiT=\Sigma x_i Nếu với xác suất 1, đối với một số hàm g , thì đó là một thống kê đầy đủ.E[g(T)]=0E[g(T)]=0E[g(T)]=0ggg Nhưng điều này có nghĩa là gì? Tôi …

1
Làm thế nào để tính toán Đường dẫn đến Nhà Trắng bằng cách sử dụng R?
Tôi vừa xem qua phân tích tuyệt vời này vừa thú vị vừa đẹp mắt: http://www.nytimes.com/interactive/2012/11/02/us/polencies/paths-to-the-white-house.html Tôi tò mò làm thế nào một "cây đường dẫn" như vậy có thể được xây dựng bằng R. Dữ liệu và thuật toán nào mà người ta cần để xây dựng một cây …


1
Dữ liệu đếm ngược
Tôi đã sử dụng stl () trong R để phân tách dữ liệu đếm thành các thành phần xu hướng, theo mùa và không đều. Các giá trị xu hướng kết quả không còn là số nguyên nữa. Tôi có những câu hỏi sau: Là stl () một cách thích …

1
Tôi có thể diễn giải sự bao gồm của một thuật ngữ bậc hai trong hồi quy logistic như chỉ ra một bước ngoặt không?
Trong một Regression với tuyến tính và bậc hai về hậu cần mà thôi, nếu tôi có một tuyến tính hệ số β1β1\beta_1 và bậc hai hệ số β2β2\beta_2 , tôi có thể nói rằng đó là bước ngoặt của xác suất tại - β1/ (2 β2)-β1/(2β2)-\beta_1 / (2\beta_2) ?



6
Một biện pháp mạnh mẽ (không tham số) như Hệ số biến đổi - IQR / trung vị, hoặc thay thế?
Đối với một tập hợp dữ liệu nhất định, mức chênh lệch thường được tính là độ lệch chuẩn hoặc là IQR (phạm vi giữa các nhóm). Trong khi a standard deviationđược chuẩn hóa (điểm z, v.v.) và do đó có thể được sử dụng để so sánh sự lây …





Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.