Gaussian đa biến mạnh mẽ phù hợp với R


11

Tôi cần phải phù hợp với phân phối Gaussian tổng quát cho đám mây điểm 7 mờ chứa khá nhiều ngoại lệ đáng kể với đòn bẩy cao. Bạn có biết gói R nào tốt cho công việc này không?


3
Bạn sẽ tìm thấy các liên kết đến ít nhất bốn gói R để xác định các ngoại lệ đa biến trong các câu trả lời cho một câu hỏi tương tự tại stats.stackexchange.com/questions/213/ . Đó có thể là một khởi đầu tốt.
whuber

Có thể câu hỏi đang lảng tránh tôi, nhưng khi phù hợp với phân phối Gaussian đa biến, tại sao không sử dụng trung bình theo kinh nghiệm và SD như MLE? Sau đó, bạn có thể tập trung vào thống kê chẩn đoán nếu có điểm ảnh hưởng / đòn bẩy cao.
AdamO

Câu trả lời:


1

Ngoài ra còn có mclust: http://www.stat.washington.edu/research/reports/2012/tr597.pdf http://cran.r-project.org/web/packages/mclust/index.html

Mặc dù vậy, một lưu ý: mô hình hỗn hợp trong không gian chiều cao có thể khiến CPU khá tốn bộ nhớ và bộ nhớ lớn nếu đám mây điểm của bạn lớn. Khoảng bốn năm trước, tôi đã thực hiện một loạt dữ liệu 11 chiều, 50-200K điểm và nó có xu hướng chạy vào 4-11GB RAM và mất tới một tuần để tính toán cho mỗi trường hợp (và tôi có 400). Điều này chắc chắn là có thể, nhưng có thể là một vấn đề đau đầu nếu bạn đang sử dụng một cụm tính toán được chia sẻ hoặc có sẵn các nguồn lực hạn chế.


1

Âm thanh này giống như Mô hình hỗn hợp Gaussian đa biến cổ điển. Tôi nghĩ rằng gói BayesM có thể hoạt động.

Dưới đây là một số gói hỗn hợp Gaussian đa biến

  • bayesm: cran.r-project.org/web/packages/bayesm/index.html
  • mixtools: www.jstatsoft.org/v32/i06/apers
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.