Tôi đang thực hiện một hỗn hợp đa dạng vanilla của Gaussian đa biến, theo Chương 10 của Nhận dạng mẫu và Học máy (Giám mục, 2007).
Cách tiếp cận Bayes yêu cầu xác định các tham số (hyper) cho Gaussian-inverse-Wishart trước:
- (tham số nồng độ của Dirichlet trước);
- (mức độ tự do của phân phối Wishart nghịch đảo);
- (các quan sát giả cho phân phối Wishart nghịch đảo Gaussian);
- (giá trị trung bình của phân phối Gaussian).
- (ma trận tỷ lệ cho Wishart nghịch đảo).
Các lựa chọn phổ biến là , , , , , trong đó là chiều của không gian.
Không có gì đáng ngạc nhiên, hậu thế có thể phụ thuộc mạnh mẽ vào sự lựa chọn tham số (cụ thể, tôi thấy rằng có tác động lớn đến số lượng thành phần, nhiều hơn ). Đối với và , các lựa chọn ở trên chỉ có ý nghĩa nếu dữ liệu đã được chuẩn hóa phần nào.
Theo cách tiếp cận Bayes theo kinh nghiệm, tôi đã nghĩ đến việc thiết lập và bằng với ma trận hiệp phương sai theo kinh nghiệm và dữ liệu theo kinh nghiệm (đối với sau này, tôi có thể có lẽ chỉ xem xét đường chéo, ngoài ra, tôi cần nhân ma trận hiệp phương sai mẫu với ). Điều này sẽ hợp lý? Bất kỳ đề nghị về các phương pháp hợp lý khác để thiết lập các tham số? (không đi theo Bayes và DPGMM phân cấp đầy đủ)
(Có một câu hỏi tương tự ở đây , nhưng không có câu trả lời nào liên quan đến câu hỏi của tôi.)