Thống kê và dữ liệu lớn

Q & A cho những người quan tâm đến thống kê, học máy, phân tích dữ liệu, khai thác dữ liệu và trực quan hóa dữ liệu





1
Rắc rối tìm mô hình tốt phù hợp với dữ liệu đếm với các hiệu ứng hỗn hợp - ZINB hoặc cái gì khác?
Tôi có một dữ liệu rất nhỏ về sự phong phú của loài ong đơn độc mà tôi gặp khó khăn khi phân tích. Đó là dữ liệu đếm, và hầu hết tất cả các số đều nằm trong một điều trị với hầu hết các số 0 trong điều …


2
Thống kê pizza cho đại chúng
Một mục ngắn trên trang web NY Times cung cấp Thông tin và Số liệu về mức tiêu thụ pizza ở Hoa Kỳ. Tôi có một mối quan tâm ngẫu nhiên về cách sử dụng số liệu thống kê (hoặc bị lạm dụng) để cung cấp thông tin cho khán …

4
Bạn có thể so sánh các phương pháp phân cụm khác nhau trên một tập dữ liệu không có sự thật cơ bản bằng cách xác thực chéo không?
Hiện tại, tôi đang cố gắng phân tích một bộ dữ liệu tài liệu văn bản không có sự thật. Tôi đã nói rằng bạn có thể sử dụng xác nhận chéo k-Fold để so sánh các phương pháp phân cụm khác nhau. Tuy nhiên, các ví dụ tôi đã …

1
Berry đảo ngược
Tôi có một dữ liệu thị trường tổng hợp lớn về doanh số bán rượu vang ở Mỹ và tôi muốn ước tính nhu cầu về một số loại rượu vang chất lượng cao nhất định. Các thị phần này về cơ bản được lấy từ một mô hình tiện …

1
Tính toán khả năng đăng nhập bằng tay bằng cách sử dụng hồi quy tổng quát bình phương nhỏ nhất phi tuyến tính (nlme)
Tôi đang cố gắng tính toán khả năng ghi nhật ký cho hồi quy bình phương nhỏ nhất phi tuyến tổng quát cho hàm tối ưu hóa bởi hàm trong gói R , sử dụng ma trận hiệp phương sai được tạo bởi khoảng cách trên cây aa phát sinh …


1
Thông tin ra khỏi ma trận mũ cho hồi quy logistic
Rõ ràng với tôi, và được giải thích rõ trên nhiều trang web, thông tin nào các giá trị trên đường chéo của ma trận mũ cung cấp cho hồi quy tuyến tính. Ma trận mũ của mô hình hồi quy logistic đối với tôi ít rõ ràng hơn. Có …



4
Giả định phân phối dư
Tại sao cần phải đặt giả định phân phối cho các lỗi, nghĩa là yTôi= Xβ+ϵiyi=Xβ+ϵiy_i = X\beta + \epsilon_{i} , với.εTôi~ N(0,σ2)ϵi∼N(0,σ2)\epsilon_{i} \sim \mathcal{N}(0,\sigma^{2}) Tại sao không viết yi=Xβ+ϵiyi=Xβ+ϵiy_i = X\beta + \epsilon_{i} , vớiyi∼N(Xβ^,σ2)yi∼N(Xβ^,σ2)y_i \sim \mathcal{N}(X\hat{\beta},\sigma^{2}) , trong đó trong cả hai trường hợp . Tôi đã thấy …

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.