Câu hỏi được gắn thẻ «machine-learning»

Các thuật toán học máy xây dựng một mô hình của dữ liệu đào tạo. Thuật ngữ "học máy" được định nghĩa mơ hồ; nó bao gồm những gì còn được gọi là học thống kê, học tăng cường, học không giám sát, v.v ... LUÔN LUÔN THÊM MỘT THÊM THÊM CỤ THỂ.


2
Tầm quan trọng tương đối của một nhóm các yếu tố dự báo trong phân loại rừng ngẫu nhiên ở R
Tôi muốn xác định tầm quan trọng tương đối của các bộ biến đối với randomForestmô hình phân loại trong R. importanceHàm cung cấp MeanDecreaseGinisố liệu cho từng dự đoán riêng lẻ - có đơn giản như việc tính tổng này qua từng bộ dự báo trong một bộ không? …

2
định dạng dữ liệu libsvm [đã đóng]
Tôi đang sử dụng công cụ libsvm ( http://www.csie.ntu.edu.tw/~cjlin/libsvm/ ) để hỗ trợ phân loại vector. Tuy nhiên, tôi bối rối về định dạng của dữ liệu đầu vào. Từ README: Định dạng của tệp dữ liệu đào tạo và kiểm tra là: <label> <index1>:<value1> <index2>:<value2> ... . . . …

3
Tiện ích của kỹ thuật tính năng: Tại sao tạo các tính năng mới dựa trên các tính năng hiện có?
Tôi thường thấy mọi người tạo ra các tính năng mới dựa trên các tính năng hiện có trên một vấn đề máy học. Ví dụ: tại đây: https://trigininequality.wordpress.com/2013/09/08/basic-feature-engineering-with-the-titanic-data/ mọi người đã coi quy mô của gia đình một người là một tính năng mới, dựa trên về số lượng …

2
Học tập có giám sát, học tập không giám sát và học tập củng cố: Cơ bản về quy trình làm việc
Học có giám sát 1) Một con người xây dựng một phân loại dựa trên đầu vào và đầu ra dữ liệu 2) Trình phân loại đó được đào tạo với một tập dữ liệu 3) Trình phân loại đó được kiểm tra với bộ dữ liệu thử nghiệm 4) …


7
Suy luận so với ước lượng?
Sự khác biệt giữa "suy luận" và "ước tính" trong bối cảnh học máy là gì? Là một người mới, tôi cảm thấy rằng chúng ta suy ra các biến ngẫu nhiên và ước tính các tham số mô hình. Sự hiểu biết này của tôi có đúng không? Nếu …


4
Kỹ thuật máy học để phân tích chuỗi?
Tôi có rất nhiều chuỗi địa chỉ: 1600 Pennsylvania Ave, Washington, DC 20500 USA Tôi muốn phân tích chúng thành các thành phần của chúng: street: 1600 Pennsylvania Ave city: Washington province: DC postcode: 20500 country: USA Nhưng tất nhiên dữ liệu là bẩn: nó đến từ nhiều quốc gia …







Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.