Một xác suất mẫu bao gồm bộ ba (Ω,F,P) , nơi Ω là không gian mẫu, F là một σ -algebra (sự kiện) và P là một thước đo khả năng trên F .
Giải thích trực quan . Một mô hình xác suất có thể được hiểu như là một tiếng biến ngẫu nhiên . Ví dụ: Đặt X là biến ngẫu nhiên phân phối thông thường với giá trị trung bình 0 và phương sai 1 . Trong trường hợp này, thước đo xác suất P được liên kết với Hàm phân phối tích lũy (CDF) F thông quaXX01PF
F(x)=P(X≤x)=P(ω∈Ω:X(ω)≤x)=∫x−∞12π−−√exp(−t22)dt.
Khái quát hóa . Định nghĩa của Mô hình Xác suất phụ thuộc vào định nghĩa toán học của xác suất, xem ví dụ Xác suất miễn phí và Xác suất lượng tử .
Một mẫu thống kê là một bộ của các mô hình xác suất, đây là, một tập hợp các biện pháp xác / phân phối trên không gian mẫu Ω .SΩ
Tập phân phối xác suất này thường được chọn để mô hình hóa một hiện tượng nhất định mà chúng tôi có dữ liệu.
Giải thích trực quan . Trong Mô hình thống kê, cả hai tham số và phân phối mô tả một hiện tượng nhất định đều không xác định. Một ví dụ của việc này là familiy của phân phối chuẩn với trung bình và phương sai σ 2 ∈ R + , đây là, cả hai thông số chưa được biết và bạn thường muốn sử dụng tập dữ liệu cho việc ước tính các thông số (ví dụ: chọn một phần tử của S ). Điều này đặt các bản phân phối có thể được lựa chọn vào bất kỳ Ω và F , nhưng, nếu tôi không nhầm, trong một ví dụ thực tế chỉ có những người được xác định trên cùng một cặp ( Ω , F )μ∈Rσ2∈R+SΩF(Ω,F) là hợp lý để xem xét.
Generalisations. This paper provides a very formal definition of Statistical Model, but the author mentions that "Bayesian model requires an additional component in the form of a prior distribution ... Although Bayesian
formulations are not the primary focus of this paper". Therefore the definition of Statistical Model depend on the kind of model we use: parametric or nonparametric. Also in the parametric setting, the definition depends on how parameters are treated (e.g. Classical vs. Bayesian).
Normal(μ0,σ20)μ0,σ20Normal(μ,σ2), where μ,σ2 are unknown parameters.
None of them require a data set, but I would say that a Statistical model is usually selected for modelling one.