Câu hỏi được gắn thẻ «classification»

Phân loại thống kê là vấn đề xác định dân số phụ mà các quan sát mới thuộc về, trong đó chưa xác định được danh tính của dân số phụ, trên cơ sở tập dữ liệu chứa các quan sát có dân số phụ. Do đó, các phân loại này sẽ cho thấy một hành vi thay đổi có thể được nghiên cứu bằng thống kê.



3
Trọng số dữ liệu gần đây hơn trong mô hình Rừng ngẫu nhiên
Tôi đang đào tạo một mô hình phân loại với Rừng ngẫu nhiên để phân biệt giữa 6 loại. Dữ liệu giao dịch của tôi có khoảng 60k + quan sát và 35 biến. Đây là một ví dụ về cách nó trông như thế nào. _________________________________________________ |user_id|acquisition_date|x_var_1|x_var_2| y_vay | …






1
Khi các lớp không cân bằng trên / dưới mẫu, tối đa hóa độ chính xác có khác với giảm thiểu chi phí phân loại sai không?
Trước hết, tôi muốn mô tả một số bố cục phổ biến mà sách Khai thác dữ liệu sử dụng giải thích cách xử lý Dữ liệu không cân bằng . Thông thường, phần chính được đặt tên là Bộ dữ liệu không cân bằng và chúng bao gồm hai …


2
Tại sao ước tính lỗi OOB rừng ngẫu nhiên cải thiện khi số lượng tính năng được chọn bị giảm?
Tôi đang áp dụng thuật toán rừng ngẫu nhiên làm phân loại trên bộ dữ liệu microarray được chia thành hai nhóm được biết đến với 1000 tính năng. Sau lần chạy đầu tiên, tôi xem xét tầm quan trọng của các tính năng và chạy lại thuật toán cây …


1
Caret glmnet vs cv.glmnet
Dường như có rất nhiều nhầm lẫn trong việc so sánh sử dụng glmnetbên trong caretđể tìm kiếm một lambda tối ưu và sử dụng cv.glmnetđể thực hiện cùng một nhiệm vụ. Nhiều câu hỏi đã được đặt ra, ví dụ: Mô hình phân loại train.glmnet so với cv.glmnet? Cách …

1
GAM vs LOESS vs splines
Bối cảnh : Tôi muốn vẽ một đường trong một phân tán mà không xuất hiện tham số, do đó tôi đang sử dụng geom_smooth()ở ggplottrong R. Nó tự động trả về geom_smooth: method="auto" and size of largest group is >=1000, so using gam with formula: y ~ s(x, bs …


Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.