Ấn tượng mà tôi có được, dựa trên một số bài báo, sách và bài báo mà tôi đã đọc, đó là cách được khuyến nghị để phù hợp với phân phối xác suất trên một tập hợp dữ liệu là bằng cách sử dụng ước tính khả năng tối đa (MLE). Tuy nhiên, là một nhà vật lý, một cách trực quan hơn là chỉ cần phù hợp với pdf của mô hình với pdf theo kinh nghiệm của dữ liệu bằng cách sử dụng bình phương tối thiểu. Tại sao sau đó MLE tốt hơn bình phương tối thiểu trong phân phối xác suất phù hợp? Ai đó có thể vui lòng chỉ cho tôi một bài báo / cuốn sách khoa học trả lời câu hỏi này không?
Linh cảm của tôi là bởi vì MLE không giả sử mô hình tiếng ồn và "tiếng ồn" trong pdf theo kinh nghiệm là không đồng nhất và không bình thường.