Các khái niệm thống kê và toán học hoàn toàn giống nhau, hiểu rằng "gia đình" là một thuật ngữ toán học chung với các biến thể kỹ thuật phù hợp với các hoàn cảnh khác nhau:
Một họ tham số là một đường cong (hoặc bề mặt hoặc tổng quát hóa chiều hữu hạn khác) trong không gian của tất cả các phân phối.
Phần còn lại của bài viết này giải thích điều đó có nghĩa là gì. Bên cạnh đó, tôi không nghĩ bất kỳ điều nào trong số này gây tranh cãi, cả về mặt toán học hay thống kê (ngoài một vấn đề nhỏ được ghi chú dưới đây). Để hỗ trợ cho ý kiến này, tôi đã cung cấp nhiều tài liệu tham khảo (chủ yếu cho các bài viết trên Wikipedia).
Thuật ngữ này của "gia đình" có xu hướng được sử dụng khi nghiên cứu các lớp của các hàm thành một tập hợp Y hoặc "bản đồ". Cho một miền X , một họ F của các bản đồ trên X được tham số hóa bởi một số bộ Θ ("tham số") là một hàmCYYX FX Θ
F:X×Θ→Y
mà (1) cho mỗi , hàm F θ : X → Y do F θ ( x ) = F ( x , θ ) là trong C Y và (2) F chính nó có một số "đẹp" tài sản.θ∈ΘFθ:X→YFθ(x)=F(x,θ)CYF
Ý tưởng là chúng tôi muốn thay đổi các chức năng từ sang Y theo cách "trơn tru" hoặc được kiểm soát. Bất Động Sản (1) phương tiện mà mỗi θ chỉ định như một chức năng, trong khi các chi tiết của tài sản (2) sẽ nắm bắt được ý nghĩa trong đó một sự thay đổi "nhỏ" trong θ gây ra một cách đầy đủ sự thay đổi "nhỏ" trong F θ .XYθθFθ
Một ví dụ toán học tiêu chuẩn, gần với một ví dụ được đề cập trong câu hỏi, là một phép đồng luân . Trong trường hợp này là loại bản đồ liên tục từ không gian tôpô X vào không gian tôpô Y ; Θ = [ 0 , 1 ] ⊂ R là khoảng thời gian đơn vị với topo thông thường của nó, và chúng tôi yêu cầu F là một liên tục bản đồ từ các sản phẩm topo X × Θ vào 0 đến F 1 ." Khi X =CY XYΘ=[0,1]⊂RFX×Θ . Nó có thể được coi là "biến dạng liên tục của bản đồ FYF0F1 chính nó là một khoảng, các bản đồ như vậy làcác đường congX=[0,1] trong và phép đồng hình là một biến dạng trơn tru từ đường cong này sang đường cong khác.Y
Đối với các ứng dụng thống kê, là tập hợp tất cả các phân phối trên R (hoặc, trong thực tế, trên R n đối với một số n , nhưng để giữ cho giải trình đơn giản, tôi sẽ tập trung vào n = 1 ). Chúng tôi có thể xác định nó với tập hợp tất cả các hàm càdlàg không giảm R → [ 0 , 1 ] trong đó việc đóng phạm vi của chúng bao gồm cả 0 và 1 : đây là các hàm phân phối tích lũy hoặc đơn giản là các hàm phân phối. Do đó, X = R vàCYRRnnn=1R→[0,1]01X=R .Y=[0,1]
Một gia đình của các bản phân phối là bất kỳ tập hợp con của . CY Một tên khác cho một gia đình là mô hình thống kê. Nó bao gồm tất cả các phân phối mà chúng tôi cho rằng chi phối các quan sát của chúng tôi, nhưng chúng tôi không biết phân phối nào là phân phối thực tế.
- Một gia đình có thể trống rỗng.
- Bản thân C Y là một gia đình.CY
- Một gia đình có thể bao gồm một phân phối duy nhất hoặc chỉ là một số lượng hữu hạn của chúng.
Những đặc điểm lý thuyết tập hợp trừu tượng này là tương đối ít quan tâm hoặc tiện ích. Chỉ khi chúng ta xem xét cấu trúc toán học bổ sung (có liên quan) trên thì khái niệm này mới trở nên hữu ích. Nhưng tính chất nào của C Y là lợi ích thống kê? Một số xuất hiện thường xuyên là:CYCY
làtập lồi: với hai phân phối F , G ∈ C Y , chúng ta có thể tạo thànhphân phối hỗn hợp(1-t) F +t G ∈Ycho tất cảt∈[0,1]. Đây là một loại "homotopy" từFđếnGCYF,G∈CY (1−t)F+tG∈Yt∈[0,1]FG .
Phần lớn của hỗ trợ các số liệu giả khác nhau, chẳng hạn như phân kỳ Kullback-Leibler hoặc số liệu Thông tin Fisher liên quan chặt chẽ.CY
có cấu trúc phụ: tương ứng với bất kỳ hai phân bốFvàGlà tổng của chúng, F ⋆ G .CYFGF⋆G
hỗ trợ nhiều chức năng tự nhiên, hữu ích, thường được gọi là "thuộc tính". Chúng bao gồm bất kỳ lượng tử cố định (như trung vị) cũng như các chấttích lũy.CY
là tập con của mộtkhông gian hàm. Như vậy, nó thừa hưởng nhiều số liệu hữu ích, chẳng hạn nhưđịnh mức sup( L ∞ Norm ) được đưa ra bởi | | F-G | | ∞ = sup x ∈ R | F(x)-G(x) | .CYL∞
||F−G||∞=supx∈R|F(x)−G(x)|.
Tự nhiên hành động nhóm trên gây ra các hành động trên C Y . Những hành động phổ biến là dịch T μ : x → x + μ và xỉ S σ : x → x σ cho σ > 0 . Hiệu quả này có trên một bản phân phối là gửi F để phân phối do F L , σ ( x ) = F ( ( x - μ )RCY Tμ:x→x+μ Sσ:x→xσσ>0FFμ,σ(x)=F((x−μ)/σ) . Những điều này dẫn đến các khái niệm về gia đình quy mô địa điểm và khái quát hóa của họ. (Tôi không cung cấp tài liệu tham khảo, bởi vì các tìm kiếm trên web mở rộng đưa ra nhiều định nghĩa khác nhau: ít nhất, ở đây, có thể là một chút tranh cãi.)
Các tính chất quan trọng phụ thuộc vào vấn đề thống kê và vào cách bạn định phân tích dữ liệu. Việc giải quyết tất cả các biến thể được đề xuất bởi các đặc điểm trước sẽ chiếm quá nhiều không gian cho phương tiện này. Hãy tập trung vào một ứng dụng quan trọng phổ biến.
Lấy ví dụ, khả năng tối đa. Trong hầu hết các ứng dụng, bạn sẽ muốn có thể sử dụng Giải tích để có được ước tính. Để làm việc này, bạn phải có khả năng "lấy dẫn xuất" trong gia đình.
( Kỹ thuật sang một bên: Cách thông thường mà điều này được thực hiện là để chọn một tên miền cho d ≥ 0 và chỉ định một liên tục, nghịch cục bộ chức năng p từ Θ vào C Y (Điều này có nghĩa rằng đối với mỗi. Q ∈ Θ có tồn tại một bóng B ( θ , ε ) , với ε > 0 mà p | B ( θ , ε ) :Θ⊂Rdd≥0pΘCYθ∈ΘB(θ,ϵ)ϵ>0bởi một lượng đủ nhỏ, chúng tôi sẽ luôn luôn có được một bản phân phối khác nhau.)) là one-to-one. Nói cách khác, nếu chúng ta thay đổi θp∣B(θ,ϵ):B(θ,ϵ)∩Θ→CYθ
Do đó, trong hầu hết các ứng dụng ML chúng tôi yêu cầu được liên tục (và hy vọng, gần như ở khắp mọi nơi khả vi) trong Θ thành phần. (Không có tính liên tục, tối đa hóa khả năng thường trở thành một vấn đề khó giải quyết.) Điều này dẫn đến định nghĩa theo định hướng khả năng sau đây của mộtpΘ gia đình tham số :
Một gia đình tham số của phân phối (đơn biến) là một bản đồ nghịch địa phương với q ⊂ R n , mà (a) mỗi F θ là một chức năng phân phối và (b) cho mỗi x ∈ R , hàm L x : θ → [ 0 , 1 ] do L x ( θ ) = F ( x ,
F:R×Θ→[0,1],
Θ⊂RnFθx∈RLx:θ→[0,1]Lx(θ)=F(x,θ) là liên tục và hầu như mọi nơi khác biệt.
Lưu ý rằng một gia đình tham số là nhiều hơn chỉ là bộ sưu tập của F θ : nó cũng bao gồm cụ thể cách thức mà giá trị tham số qFFθθ tương ứng với phân phối.
Hãy kết thúc với một số ví dụ minh họa.
Đặt là tập hợp của tất cả các phân phối chuẩn. Như đã cho, đây không phải là một gia đình tham số: nó chỉ là một gia đình. Để được tham số, chúng ta phải chọn một tham số. Một cách là chọn Θ = { ( μ , σ ) ∈ R 2 | σ > 0 }
và để ánh xạ ( μ , σ ) để phân phối chuẩn với trung bình μ
và phương sai σ 2CYΘ={(μ,σ)∈R2∣σ>0}(μ,σ)μσ2 .
Tập hợp các Poisson phân phối(λ) là một gia đình tham số với λ∈Θ=(0,∞)⊂R1 .
Tập hợp các Uniform phân phối (có tính năng nổi bật trong nhiều bài tập sách giáo khoa) là một gia đình tham số với
θ ∈ R 1 . Trong trường hợp này, F θ ( x ) = max ( 0 , min ( 1 , x - θ ) ) là khả vi trong θ trừ
θ ∈ { x , x - 1 } .(θ,θ+1)θ∈R1Fθ(x)=max(0,min(1,x−θ))θθ∈{x,x−1}
Let F and G be any two distributions. Then F(x,θ)=(1−θ)F(x)+θG(x) is a parametric family for θ∈[0,1]. (Proof: the image of F is a set of distributions and its partial derivative in θ equals −F(x)+G(x) which is defined everywhere.)
Θ⊂R4, which includes (among others) the Normal distributions, Beta distributions, and Inverse Gamma distributions. This illustrates the fact that any one given distribution may belong to many different distribution families. This is perfectly analogous to observing that any point in a (sufficiently large) space may belong to many paths that intersect there. This, together with the previous construction, shows us that no distribution uniquely determines a family to which it belongs.
The family CY of all finite-variance absolutely continuous distributions is not parametric. The proof requires a deep theorem of topology: if we endow CY with any topology (whether statistically useful or not) and p:Θ→CY is continuous and locally has a continuous inverse, then locally CY must have the same dimension as that of Θ. However, in all statistically meaningful topologies, CY is infinite dimensional.