Thống kê và dữ liệu lớn

Q & A cho những người quan tâm đến thống kê, học máy, phân tích dữ liệu, khai thác dữ liệu và trực quan hóa dữ liệu



2
Tại sao tên là kernel kernel trong thống kê và ML?
Điều này đã được hỏi trên các trang SE khác trong bối cảnh hệ điều hành và đại số tuyến tính, nhưng câu hỏi tương tự làm tôi bối rối về các phương pháp kernel được sử dụng trong thống kê và học máy. Thông thường người ta nói rằng …


3
Có sự khác biệt nào giữa Người thường xuyên và Bayes về định nghĩa Khả năng sống không?
Một số nguồn cho biết chức năng khả năng không phải là xác suất có điều kiện, một số người cho rằng nó là. Điều này rất khó hiểu với tôi. Theo hầu hết các nguồn tôi đã thấy, khả năng phân phối với tham số , phải là sản …



2
Giới hạn của công cụ ước tính hồi quy sườn núi đơn vị-độ sai lệch khi
Xem xét hồi quy sườn với một ràng buộc bổ sung yêu cầu có tổng đơn vị bình phương (tương đương, phương sai đơn vị); nếu cần, người ta có thể giả sử rằng cũng có tổng đơn vị bình phương:y^y^\hat{\mathbf y}yy\mathbf y β^∗λ=argmin{∥y−Xβ∥2+λ∥β∥2}s.t.∥Xβ∥2=1.β^λ∗=arg⁡min{‖y−Xβ‖2+λ‖β‖2}s.t.‖Xβ‖2=1.\hat{\boldsymbol\beta}_\lambda^* = \arg\min\Big\{\|\mathbf y - \mathbf X …

4
Với kích thước mẫu đủ lớn, một thử nghiệm sẽ luôn hiển thị kết quả quan trọng trừ khi kích thước hiệu ứng thực sự chính xác bằng không. Tại sao?
Tôi tò mò về một yêu cầu được đưa ra trong bài viết của Wikipedia về kích thước hiệu ứng . Đặc biệt: [...] một so sánh thống kê không có giá trị sẽ luôn hiển thị kết quả có ý nghĩa thống kê trừ khi kích thước hiệu ứng …

4
Điểm báo cáo thống kê mô tả là gì?
Tôi vừa thực hiện phân tích dữ liệu của mình bằng phương pháp hồi quy logistic tuy nhiên tôi cũng được yêu cầu phải có phần Thống kê mô tả trong báo cáo của mình. Tôi thực sự không nhìn thấy điểm trong điều này và tôi đã hy vọng …



1
Cho thấy 100 phép đo cho 5 đối tượng cung cấp thông tin ít hơn nhiều so với 5 phép đo cho 100 đối tượng
Tại một hội nghị, tôi tình cờ nghe được tuyên bố sau: 100 phép đo cho 5 đối tượng cung cấp thông tin ít hơn nhiều so với 5 phép đo cho 100 đối tượng. Rõ ràng là điều này là đúng, nhưng tôi đã tự hỏi làm thế nào …



Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.