Thống kê và dữ liệu lớn

Q & A cho những người quan tâm đến thống kê, học máy, phân tích dữ liệu, khai thác dữ liệu và trực quan hóa dữ liệu

1
Khi các lớp không cân bằng trên / dưới mẫu, tối đa hóa độ chính xác có khác với giảm thiểu chi phí phân loại sai không?
Trước hết, tôi muốn mô tả một số bố cục phổ biến mà sách Khai thác dữ liệu sử dụng giải thích cách xử lý Dữ liệu không cân bằng . Thông thường, phần chính được đặt tên là Bộ dữ liệu không cân bằng và chúng bao gồm hai …









3
Tạo trọng số phân bố đồng đều mà tổng hợp?
Người ta thường sử dụng các trọng số trong các ứng dụng như mô hình hỗn hợp và kết hợp tuyến tính các hàm cơ bản. Trọng lượng wiwiw_i phải thường xuyên tuân theo wi≥wi≥w_i ≥ 0 và ∑iwi=1∑iwi=1\sum_{i} w_i=1 . Tôi muốn chọn ngẫu nhiên một vectơ trọng lượng …



2
Ví dụ về khai thác văn bản với R (gói tm)
Tôi đã dành ba ngày để tìm tmhiểu sau khi đọc một bản thảo của một người bạn nơi anh ta khám phá một văn bản văn bản với UCINET, hiển thị các đám mây văn bản, đồ thị mạng hai chế độ và Phân tích giá trị đơn (với …
14 r  text-mining 



Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.