Thống kê và dữ liệu lớn

Q & A cho những người quan tâm đến thống kê, học máy, phân tích dữ liệu, khai thác dữ liệu và trực quan hóa dữ liệu



5
Kernel SVM: Tôi muốn một sự hiểu biết trực quan về ánh xạ tới không gian tính năng chiều cao hơn và cách điều này giúp phân tách tuyến tính có thể
Tôi đang cố gắng để hiểu được trực giác đằng sau kernel SVM. Bây giờ, tôi hiểu cách thức hoạt động của SVM tuyến tính, theo đó một dòng quyết định được thực hiện để phân chia dữ liệu tốt nhất có thể. Tôi cũng hiểu nguyên tắc đằng sau …




3
Làm cách nào để tôi có thể lập trình phát hiện các phân đoạn của chuỗi dữ liệu để phù hợp với các đường cong khác nhau?
Có bất kỳ thuật toán tài liệu nào để tách các phần của một tập dữ liệu nhất định thành các đường cong khác nhau phù hợp nhất không? Ví dụ, hầu hết mọi người nhìn vào biểu đồ dữ liệu này sẽ dễ dàng chia nó thành 3 phần: …


3
mất bản lề so với ưu điểm và nhược điểm
Mất bản lề có thể được xác định bằng và mất bản ghi có thể được định nghĩa làtối đa ( 0 , 1 - yTôiwTxTôi)tối đa(0,1-yTôiwTxTôi)\text{max}(0, 1-y_i\mathbf{w}^T\mathbf{x}_i)đăng nhập ( 1 + điểm kinh nghiệm( - yTôiwTxTôi) )đăng nhập(1+điểm kinh nghiệm⁡(-yTôiwTxTôi))\text{log}(1 + \exp(-y_i\mathbf{w}^T\mathbf{x}_i)) Tôi có những câu hỏi sau: Có …


3
Splines vs Gaussian Regression
Tôi biết rằng Gaussian Process Regression (GPR) là một giải pháp thay thế cho việc sử dụng các spline để phù hợp với các mô hình phi tuyến linh hoạt. Tôi muốn biết trong những tình huống nào thì một tình huống sẽ phù hợp hơn các tình huống khác, …

1
Tại sao các mô hình hiệu ứng hỗn hợp giải quyết sự phụ thuộc?
Giả sử chúng tôi quan tâm đến việc điểm thi của học sinh bị ảnh hưởng như thế nào bởi số giờ học của những học sinh đó. Để khám phá mối quan hệ này, chúng ta có thể chạy hồi quy tuyến tính sau: exam.gradesi=a+β1×hours.studiedi+eiexam.gradesi=a+β1×hours.studiedi+ei \text{exam.grades}_i = a + …




Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.