Câu hỏi được gắn thẻ «many-categories»

Các biến phân loại với số lượng lớn các cấp và phương pháp thống kê để làm việc với các biến đó (ví dụ: laze hợp nhất).

6
Nguyên tắc cách thu gọn các biến phân loại với nhiều cấp độ?
Những kỹ thuật nào có sẵn để thu gọn (hoặc gộp) nhiều loại thành một số ít, với mục đích sử dụng chúng làm đầu vào (dự đoán) trong mô hình thống kê? Hãy xem xét một biến như chuyên ngành sinh viên đại học (ngành học được chọn bởi …


6
Các vấn đề với biểu đồ tròn
Dường như có sự thảo luận ngày càng tăng về biểu đồ tròn. Các đối số chính chống lại nó dường như là: Diện tích được cảm nhận với sức mạnh ít hơn chiều dài. Biểu đồ hình tròn có tỷ lệ điểm-điểm-dữ liệu rất thấp Tuy nhiên, tôi nghĩ …



4
Độ chính xác của máy tăng cường độ dốc giảm khi số lần lặp tăng
Tôi đang thử nghiệm thuật toán máy tăng cường độ dốc thông qua caretgói trong R. Sử dụng một bộ dữ liệu tuyển sinh đại học nhỏ, tôi đã chạy đoạn mã sau: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] …
15 machine-learning  caret  boosting  gbm  hypothesis-testing  t-test  panel-data  psychometrics  intraclass-correlation  generalized-linear-model  categorical-data  binomial  model  intercept  causality  cross-correlation  distributions  ranks  p-value  z-test  sign-test  time-series  references  terminology  cross-correlation  definition  probability  distributions  beta-distribution  inverse-gamma  missing-data  paired-comparisons  paired-data  clustered-standard-errors  cluster-sample  time-series  arima  logistic  binary-data  odds-ratio  medicine  hypothesis-testing  wilcoxon-mann-whitney  unsupervised-learning  hierarchical-clustering  neural-networks  train  clustering  k-means  regression  ordinal-data  change-scores  machine-learning  experiment-design  roc  precision-recall  auc  stata  multilevel-analysis  regression  fitting  nonlinear  jmp  r  data-visualization  gam  gamm4  r  lme4-nlme  many-categories  regression  causality  instrumental-variables  endogeneity  controlling-for-a-variable 

4
Đã sửa hiệu ứng so với hiệu ứng ngẫu nhiên khi tất cả các khả năng được đưa vào mô hình hiệu ứng hỗn hợp
Trong mô hình hiệu ứng hỗn hợp, khuyến nghị là sử dụng hiệu ứng cố định để ước tính một tham số nếu bao gồm tất cả các mức có thể (ví dụ: cả nam và nữ). Bạn cũng nên sử dụng hiệu ứng ngẫu nhiên để tính toán một …



1





1
Mã hóa các tính năng phân loại cao (nhiều loại) khi các tính năng khác nhau rất nhiều về tính chính xác
Tôi đã xem qua các câu hỏi liên quan đến mã hóa tính năng phân loại, nhưng không thể tìm thấy bất kỳ điều gì thảo luận về vấn đề của tôi. Xin lỗi nếu tôi bỏ lỡ nó. Giả sử chúng ta có một bộ dữ liệu với các …

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.