Gần như mọi nguồn hoặc người tôi từng tương tác ngoại trừ nguồn Wolfram mà bạn liên kết đều đề cập đến quy trình như khớp một mô hình với dữ liệu . Điều này có ý nghĩa, vì mô hình là đối tượng động và dữ liệu là tĩnh (còn gọi là cố định và không đổi).
Để đưa ra quan điểm về nó, tôi thích cách tiếp cận của Larry Wasserman về vấn đề này. Theo ông, một mô hình thống kê là một tập hợp các phân phối. Ví dụ: bộ sưu tập của tất cả các bản phân phối bình thường:
{ Bình thường ( μ , σ) : Μ , σ∈ R , σ> 0 }
hoặc tập hợp tất cả các bản phân phối Poisson:
{ Poisson ( λ ) : λ ∈ R , λ > 0 }
Ghép phân phối vào dữ liệu là bất kỳ thuật toán nào kết hợp mô hình thống kê với một tập hợp dữ liệu (dữ liệu được cố định) và chọn chính xác một trong các phân phối từ mô hình làm mô hình "tốt nhất" phản ánh dữ liệu.
Mô hình là thứ thay đổi (loại): chúng tôi đang thu gọn nó từ toàn bộ bộ sưu tập các khả năng thành một lựa chọn tốt nhất. Dữ liệu chỉ là dữ liệu; không có gì xảy ra với nó cả