Thống kê và dữ liệu lớn machine-learning

2

Sự biện minh cho sự rời rạc không giám sát của các biến liên tục là gì?

Một số nguồn cho thấy có nhiều hậu quả tiêu cực của sự rời rạc (phân loại) các biến liên tục trước khi phân tích thống kê (mẫu tài liệu tham khảo [1] - [4] bên dưới). Ngược lại [5] gợi ý rằng một số kỹ thuật học máy được …

8 machine-learning generalized-linear-model categorical-data binning

3

Thư viện máy học hoàn chỉnh cho Java / Scala [đã đóng]

Đã đóng cửa. Câu hỏi này không đúng chủ đề . Nó hiện không chấp nhận câu trả lời. Bạn muốn cải thiện câu hỏi này? Cập nhật câu hỏi để nó thuộc chủ đề cho Xác thực chéo. Đóng cửa 4 năm trước . Python có rất nhiều thư …

8 machine-learning python software java

1

Mô hình hỗn hợp không đối xứng và cụm

Tôi có một câu hỏi về các cụm mà tôi đang dự tính để điều trị bằng cách tiếp cận hỗn hợp không theo tỷ lệ (tôi nghĩ). Tôi đang làm việc trên lời giải thích về sự ép buộc của con người. Mỗi hàng trong cơ sở dữ liệu …

8 machine-learning clustering computational-statistics mixture

3

Dự đoán biến liên tục bằng cách sử dụng gói của bnlearn trên R

Tôi sử dụng gói bnlearn trong R để tìm hiểu cấu trúc của Mạng Bayes và các tham số của nó. Điều tôi muốn làm là "dự đoán" giá trị của một nút được đưa ra giá trị của các nút khác làm bằng chứng (rõ ràng, ngoại trừ nút …

8 r machine-learning prediction bayesian-network

1

Sẽ có một vấn đề lựa chọn mô hình nếu chúng ta có quyền truy cập vào một lời sấm truyền cho chúng ta lỗi tổng quát hóa chính xác?

Đặt một hàm đưa ra một số giả thuyết h trả về lỗi tổng quát hóa cho h cố định đó .E(h)E(h)\mathcal{E(h)}hhhhhh Tôi đã đọc một số lưu ý về lựa chọn mô hình và lỗi tổng quát hóa và nó nói: "Nếu chúng tôi có quyền truy cập vào …

8 machine-learning model

2

xây dựng một mô hình phân loại cho dữ liệu nhị phân nghiêm ngặt

tôi có một bộ dữ liệu là nhị phân. mỗi bộ giá trị của biến nằm trong miền: true, false. thuộc tính "đặc biệt" của tập dữ liệu này là phần lớn các giá trị là "sai". tôi đã sử dụng một thuật toán học mạng bayes để học một …

8 machine-learning classification svm random-forest bayesian-network

2

Tại sao một mô hình thống kê sẽ phù hợp hơn nếu được cung cấp một bộ dữ liệu khổng lồ?

Dự án hiện tại của tôi có thể yêu cầu tôi xây dựng một mô hình để dự đoán hành vi của một nhóm người nhất định. tập dữ liệu huấn luyện chỉ chứa 6 biến (id chỉ dành cho mục đích nhận dạng): id, age, income, gender, job category, …

8 modeling large-data overfitting clustering algorithms error spatial r regression predictive-models linear-model average measurement-error weighted-mean error-propagation python standard-error weighted-regression hypothesis-testing time-series machine-learning self-study arima regression correlation anova statistical-significance excel r regression distributions statistical-significance contingency-tables regression optimization measurement-error loss-functions image-processing java panel-data probability conditional-probability r lme4-nlme model-comparison time-series probability probability conditional-probability logistic multiple-regression model-selection r regression model-based-clustering svm feature-selection feature-construction time-series forecasting stationarity r distributions bootstrap r distributions estimation maximum-likelihood garch references probability conditional-probability regression logistic regression-coefficients model-comparison confidence-interval r regression r generalized-linear-model outliers robust regression classification categorical-data r association-rules machine-learning distributions posterior likelihood r hypothesis-testing normality-assumption missing-data convergence expectation-maximization regression self-study categorical-data regression simulation regression self-study self-study gamma-distribution modeling microarray synthetic-data

1

Làm thế nào và tại sao MLP để phân loại khác với MLP cho hồi quy? Chức năng backpropagation và chuyển khác nhau?

Tôi đang sử dụng hai tri giác đa lớp (MLP) 3 lớp. Với cùng một dữ liệu đầu vào (14 nơ ron đầu vào), tôi thực hiện một phân loại (đúng / sai) và một hồi quy (nếu đúng, "bao nhiêu"). Cho đến thời điểm hiện tại, tôi đã lười …

8 regression machine-learning backpropagation

4

Làm cách nào để chọn phân chia trong Rừng ngẫu nhiên cho các yếu tố dự đoán phân loại (tính năng)?

Tôi hiểu cách phân chia tốt nhất được chọn cho rừng ngẫu nhiên cho các yếu tố dự đoán số (tính năng). Các dự đoán số được sắp xếp sau đó cho mỗi giá trị tạp chất hoặc entropy Gini được tính toán và ngưỡng được chọn để phân chia …

8 machine-learning random-forest

1

Tại sao Quy trình Dirichlet không phù hợp cho các ứng dụng trong phần không đối xứng Bayes?

Bản chất riêng biệt của DP làm cho nó không phù hợp cho các ứng dụng chung trong không đối xứng Bayes, nhưng nó rất phù hợp cho vấn đề đặt linh mục lên các thành phần hỗn hợp trong mô hình hỗn hợp. Trích dẫn này là từ Quy …

8 machine-learning mcmc dirichlet-process

3

Làm cách nào để thực hiện phân loại Rừng ngẫu nhiên không giám sát bằng mã của Breiman?

Tôi đang làm việc với mã rừng ngẫu nhiên của Breiman ( http: //stat-www.ber siêu.edu/users/oustiman/RandomForests/cc_manual.htmlm#c2 ) để phân loại dữ liệu vệ tinh (học có giám sát). Tôi đang sử dụng tập dữ liệu huấn luyện và kiểm tra có cỡ mẫu 2000 và kích thước thay đổi 10. Dữ …

8 machine-learning classification random-forest

2

Phương pháp học máy có thể bằng cách nào đó hữu ích trong việc giải phương trình vi phân?

Tôi đã lưu ý rằng tác vụ hồi quy trong học máy bằng cách nào đó có liên quan đến việc giải các phương trình vi phân xấp xỉ - cả hai đều cố gắng xấp xỉ hàm chưa biết. Sau đó, câu hỏi của tôi là: ML có thể …

8 machine-learning

3

Tại sao svm không tốt như cây quyết định trên cùng một dữ liệu?

Tôi chưa quen với học máy và cố gắng sử dụng scikit-learn (sklearn) để giải quyết vấn đề phân loại. Cả Quyết định và SVM đều có thể đào tạo một trình phân loại cho vấn đề này. Tôi sử dụng sklearn.ensemble.RandomForestClassifiervà sklearn.svm.SVCđể phù hợp với cùng một dữ liệu …

8 machine-learning classification svm scikit-learn

1

Dự đoán người chiến thắng trận bóng đá chỉ dựa trên kết quả của các trận đấu trước đó giữa hai đội

Tôi là một người hâm mộ bóng đá (bóng đá) khổng lồ và cũng thích học máy. Là một dự án cho khóa ML của tôi, tôi đang cố gắng xây dựng một mô hình dự đoán cơ hội chiến thắng cho đội chủ nhà, được đặt tên của đội …

8 regression machine-learning predictive-models neural-networks

2

Làm thế nào để so sánh thống kê hai thuật toán trên ba bộ dữ liệu trong lựa chọn và phân loại tính năng?

Vấn đề cơ bản: Là một phần trong nghiên cứu của tôi, tôi đã viết hai thuật toán có thể chọn một bộ tính năng từ một bộ dữ liệu (dữ liệu biểu hiện gen từ bệnh nhân ung thư). Các tính năng này sau đó được kiểm tra để …

8 machine-learning statistical-significance computational-statistics standardization genetic-algorithms

Câu hỏi được gắn thẻ «machine-learning»