Câu hỏi được gắn thẻ «residuals»

Phần dư của một mô hình là các giá trị thực tế trừ đi các giá trị dự đoán. Nhiều mô hình thống kê đưa ra các giả định về lỗi, được ước tính bởi phần dư.

2
Đánh giá mô hình hồi quy logistic
Câu hỏi này xuất phát từ sự nhầm lẫn thực tế của tôi về cách quyết định xem một mô hình logistic có đủ tốt hay không. Tôi có các mô hình sử dụng trạng thái của các cặp dự án riêng lẻ hai năm sau khi chúng được hình …



1
Gói GBM so với Caret sử dụng GBM
Tôi đã điều chỉnh mô hình bằng cách sử dụng caret, nhưng sau đó chạy lại mô hình bằng gbmgói. Theo hiểu biết của tôi rằng caretgói sử dụng gbmvà đầu ra phải giống nhau. Tuy nhiên, chỉ cần chạy thử nhanh bằng cách sử dụng data(iris)cho thấy sự khác …


5
Làm thế nào để thực hiện việc cắt bỏ các giá trị trong số lượng điểm dữ liệu rất lớn?
Tôi có một bộ dữ liệu rất lớn và thiếu khoảng 5% giá trị ngẫu nhiên. Các biến này có mối tương quan với nhau. Ví dụ R tập dữ liệu sau đây chỉ là một ví dụ đồ chơi với dữ liệu tương quan giả. set.seed(123) # matrix of …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

4
Giả định phân phối dư
Tại sao cần phải đặt giả định phân phối cho các lỗi, nghĩa là yTôi= Xβ+ϵiyi=Xβ+ϵiy_i = X\beta + \epsilon_{i} , với.εTôi~ N(0,σ2)ϵi∼N(0,σ2)\epsilon_{i} \sim \mathcal{N}(0,\sigma^{2}) Tại sao không viết yi=Xβ+ϵiyi=Xβ+ϵiy_i = X\beta + \epsilon_{i} , vớiyi∼N(Xβ^,σ2)yi∼N(Xβ^,σ2)y_i \sim \mathcal{N}(X\hat{\beta},\sigma^{2}) , trong đó trong cả hai trường hợp . Tôi đã thấy …

2
Tại sao một số người kiểm tra các giả định mô hình giống như hồi quy trên dữ liệu thô của họ và những người khác kiểm tra chúng trên phần dư?
Tôi là một sinh viên tiến sĩ về tâm lý học thực nghiệm và tôi cố gắng cải thiện các kỹ năng và kiến ​​thức về cách phân tích dữ liệu của mình. Cho đến năm thứ 5 ngành Tâm lý học, tôi đã nghĩ rằng các mô hình giống …


2
Phân tích hồi quy logistic
Câu hỏi này là loại chung chung và dài dòng, nhưng xin vui lòng chịu đựng với tôi. Trong ứng dụng của mình, tôi có nhiều bộ dữ liệu, mỗi bộ gồm ~ 20.000 datapoint với ~ 50 tính năng và một biến nhị phân phụ thuộc duy nhất. Tôi …

1




1
Tại sao chẩn đoán dựa trên dư?
Trong hồi quy tuyến tính đơn giản, người ta thường muốn xác minh nếu các giả định nhất định được đáp ứng để có thể thực hiện suy luận (ví dụ: phần dư được phân phối bình thường). Có hợp lý để kiểm tra các giả định bằng cách kiểm …

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.