Tôi đang cố gắng học cách sử dụng Trường ngẫu nhiên Markov để phân đoạn các vùng trong một hình ảnh. Tôi không hiểu một số tham số trong MRF hoặc tại sao tối đa hóa kỳ vọng tôi thực hiện không hội tụ đến một giải pháp đôi khi.
Bắt đầu từ định lý của Bayes, tôi có , trong đó y là giá trị thang màu xám của pixel và x là nhãn lớp. Tôi đã chọn sử dụng phân phối Gaussian cho p ( y | x ) , trong khi p ( x ) được mô hình hóa bằng MRF.
Tôi sử dụng một hàm tiềm năng cho MRF có cả tiềm năng phân cụm theo cặp và giá trị tiềm năng cho nhãn lớp của pixel được phân loại. Giá trị tiềm năng pixel đơn là một số hằng số phụ thuộc vào nhãn lớp x . Các hàm tiềm năng theo cặp được đánh giá cho các lân cận 4 được kết nối và trả về dương β nếu hàng xóm có cùng nhãn lớp với pixel này và - β nếu các nhãn khác nhau.
Tại điểm trong tối đa hóa kỳ vọng nơi tôi phải tìm các giá trị của và β tối đa hóa giá trị kỳ vọng của loga tôi đã sử dụng một phương pháp tối ưu hóa số (cố gắng dốc liên hợp, BFGS, phương pháp Powell) nhưng sẽ luôn thấy rằng giá trị của β sẽ trở thành tiêu cực, các α s sẽ tăng đáng kể và một lần lặp hoặc hai sau đó là toàn bộ hình ảnh sẽ được gán cho một nhãn chỉ (nền: gán nhãn lớp cho các thông số MRF đã được thực hiện sử dụng ICM). Nếu tôi loại bỏ các bảng chữ cái, tức là chỉ sử dụng các tiềm năng ghép đôi, thì tối đa hóa kỳ vọng sẽ hoạt động tốt.
Hãy giải thích mục đích của bảng chữ cái cho mỗi lớp là gì? Tôi nghĩ rằng chúng sẽ liên quan đến số lượng của lớp có trong hình ảnh, nhưng nó không xuất hiện. Khi tôi đã làm cho MRF chỉ hoạt động với các tiềm năng theo cặp, tôi đã so sánh nó với Mô hình hỗn hợp Gaussian thẳng tiến và thấy rằng chúng tạo ra kết quả gần như giống hệt nhau. Tôi đã mong đợi các tiềm năng theo cặp sẽ làm giảm bớt các lớp một chút, nhưng điều đó đã không xảy ra. Xin tư vấn nơi tôi đã đi sai.