Tại sao cần phải đặt giả định phân phối cho các lỗi, nghĩa là
, với.
Tại sao không viết
, với ,
trong đó trong cả hai trường hợp . Tôi đã thấy nó nhấn mạnh rằng các giả định phân phối được đặt trên các lỗi, không phải dữ liệu, nhưng không có lời giải thích.
Tôi không thực sự hiểu sự khác biệt giữa hai công thức này. Một số nơi tôi thấy các giả định phân phối được đặt trên dữ liệu (Bayesian lit. có vẻ như là chủ yếu), nhưng hầu hết các giả định được đặt vào các lỗi.
Khi lập mô hình, tại sao người ta nên / nên chọn bắt đầu với các giả định về cái này hay cái khác?