Các kiểu hiệp phương sai khác nhau cho các mô hình hỗn hợp Gaussian


12

Trong khi thử Mô hình hỗn hợp Gaussian ở đây , tôi đã tìm thấy 4 loại hiệp phương sai này.

'full' (each component has its own general covariance matrix),
'tied' (all components share the same general covariance matrix),
'diag' (each component has its own diagonal covariance matrix),
'spherical' (each component has its own single variance).

Tôi đã googled rất nhiều để tìm thêm chi tiết về từng loại này nhưng chỉ tìm thấy các mô tả cấp cao (như thế này ).

Đánh giá cao nếu ai đó có thể giúp tôi hiểu những điều này, hoặc ít nhất là hướng tôi đến một nơi nào đó tôi có thể đọc về những điều này.

Câu trả lời:


16

Một phân phối Gaussian được xác định hoàn toàn bởi ma trận hiệp phương sai và giá trị trung bình của nó (một vị trí trong không gian). Ma trận hiệp phương sai của phân bố Gaussian xác định hướng và độ dài của trục của các đường viền mật độ của nó, tất cả đều là ellipsoids.

Bốn loại mô hình hỗn hợp này có thể được minh họa một cách tổng quát bằng cách sử dụng trường hợp hai chiều. Trong mỗi ô đường viền của mật độ hỗn hợp, hai thành phần nằm ở và với trọng lượng lần lượt là và . Các trọng số khác nhau sẽ làm cho các tập hợp đường viền trông hơi khác nhau ngay cả khi các ma trận hiệp phương sai giống nhau, nhưng hình dạng tổng thể của các đường viền riêng lẻ vẫn sẽ giống nhau cho các ma trận giống hệt nhau.(0,0)(4,5)3/52/5

Nhân vật

Nhấp vào hình ảnh sẽ hiển thị một phiên bản ở độ phân giải cao hơn.

NB Đây là các lô của hỗn hợp thực tế, không phải của các thành phần riêng lẻ. Do các thành phần được phân tách tốt và có trọng lượng tương đương, nên các đường viền hỗn hợp gần giống với các đường viền thành phần (ngoại trừ ở mức thấp nơi chúng có thể làm biến dạng và hợp nhất, như thể hiện ở trung tâm của biểu đồ "bị ràng buộc").

  • Đầy đủ có nghĩa là các thành phần có thể độc lập chấp nhận bất kỳ vị trí và hình dạng.

  • Bị trói có nghĩa là chúng có hình dạng giống nhau, nhưng hình dạng có thể là bất cứ thứ gì.

  • Đường chéo có nghĩa là các trục đường viền được định hướng dọc theo trục tọa độ, nhưng nếu không thì độ lệch tâm có thể khác nhau giữa các thành phần.

  • Tied Dia chéo là một tình huống "bị trói" trong đó các trục đường viền được định hướng dọc theo trục tọa độ. (Tôi đã thêm điều này bởi vì ban đầu nó là cách tôi hiểu sai "đường chéo.")

  • Hình cầu là một tình huống "đường chéo" với các đường viền tròn (hình cầu ở kích thước cao hơn, từ đó gọi tên).

Điều này thể hiện một gam từ hỗn hợp chung nhất có thể đến một loại hỗn hợp rất cụ thể. Các hạn chế khác (khó hơn) là có thể, đặc biệt là ở các chiều cao hơn, nơi số lượng tham số tăng nhanh. (Ma trận hiệp phương sai theo chiều được mô tả bởi tham số độc lập.)nn(n+1)/2


Câu trả lời chính xác. Cảm ơn bạn. Một câu hỏi cuối cùng. Đây có phải là 4 loại duy nhất? hoặc có bất kỳ loại khác quá?
Bee

1
1

Cảm ơn. Tôi chỉ so sánh các mô tả trích dẫn trong bài viết của tôi và câu trả lời của bạn. Trong tôi, 'Tied' là người duy nhất được chia sẻ bởi tất cả các thành phần. Nhưng trong bạn, 'Full' dường như là cái duy nhất KHÔNG được chia sẻ bởi mỗi thành phần. Tôi chỉ cảm thấy như 2 điều này là mâu thuẫn. (Tôi chắc chắn mình đang thiếu thứ gì đó). Bạn có phiền giải thích điều đó? Cảm ơn rất nhiều.
Bee

Tôi không thấy bất kỳ mâu thuẫn nào: Tôi đã thể hiện chính xác các điều kiện bạn vạch ra. Thật vậy, tôi đã không tham khảo bất kỳ nguồn nào khác để tạo ra những hình ảnh này.
whuber

1
Cảm ơn bạn - Tôi hiểu ý của bạn. Tôi sẽ cập nhật lời giải thích để phản ánh điều đó.
whuber
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.