Để hiểu được cuộc thảo luận của Watanabe, điều quan trọng là phải nhận ra rằng ý nghĩa của "điểm kỳ dị". Điểm kỳ dị (nghiêm ngặt) trùng khớp với khái niệm hình học của số liệu số ít trong lý thuyết của ông.
tr.10 [Watanabe]: "Một mô hình thống kê p(x∣w) được gọi là thường xuyên nếu nó có thể xác định được và có một số liệu xác định dương. Nếu một mô hình thống kê không đều, thì nó được gọi là số ít."
Trong thực tế, điểm kỳ dị thường phát sinh khi số liệu thông tin Fisher gây ra bởi mô hình bị suy biến trên đa tạp được xác định bởi mô hình, như các trường hợp xếp hạng thấp hoặc thưa thớt trong hoạt động "học máy".
Những gì Watanabe nói về sự hội tụ của phân kỳ KL theo kinh nghiệm với giá trị lý thuyết của nó có thể được hiểu như sau. Một nguồn gốc của khái niệm phân kỳ xuất phát từ số liệu thống kê mạnh mẽ. M-ước lượng, trong đó bao gồm MLE như một trường hợp đặc biệt có chức năng tương phản , thường được thảo luận sử dụng topo yếu. Thật hợp lý khi thảo luận về hành vi hội tụ bằng cách sử dụng cấu trúc liên kết yếu trên không gian M ( X ) (đa dạng của tất cả các biện pháp có thể được xác định trên không gian X của Ba Lanρ(θ,δ(X))=−logp(X∣θ)M(X)X) bởi vì chúng tôi muốn nghiên cứu hành vi mạnh mẽ của MLE. Một định lý cổ điển trong [Huber] tuyên bố rằng với cũng tách chức năng phân kỳ . inf | θ - θ 0 | ≥ ε ( | D ( θ 0 , θ ) - D ( θ 0 , q 0 ) | ) > 0D(θ0,θ)=Eθ0ρ(θ,δ)
inf|θ−θ0|≥ϵ(|D(θ0,θ)−D(θ0,θ0)|)>0
và tốt xấp xỉ thực nghiệm chức năng trái ngược với phân kỳ,
cùng với quy luật, chúng tôi có thể mang lại tính nhất quán trong ý nghĩa
^ θ n :=mộtrgsupθ∣∣∣1n∑iρ(θ,δ(Xi))−D(θ0,θ)∣∣∣→0,n→∞
sẽ hội tụ về
q 0 trong xác suất
P θ 0 . Kết quả này đòi hỏi các điều kiện chính xác hơn nhiều nếu chúng ta so sánh với kết quả của Doob [Doob] về tính nhất quán yếu của công cụ ước tính Bayes.
θn^:=argminθρ(θ,δ(Xn))
θ0Pθ0
Vì vậy, ở đây ước tính Bayes và phân kỳ MLE. Nếu chúng ta vẫn sử dụng cấu trúc liên kết yếu để thảo luận về tính nhất quán của các công cụ ước tính Bayes, thì điều đó là vô nghĩa vì các công cụ ước tính Bayes sẽ luôn luôn (với xác suất một) được thống nhất bởi Doob. Do đó, một cấu trúc liên kết phù hợp hơn là cấu trúc liên kết phân phối Schwarz cho phép các dẫn xuất yếu và lý thuyết của von Mise ra đời. Barron đã có một báo cáo kỹ thuật rất hay về chủ đề này về cách chúng ta có thể sử dụng định lý Schwartz để có được sự thống nhất.
D
"Kết quả học tập duy nhất" bị ảnh hưởng bởi vì, như chúng ta thấy, định lý tính nhất quán của Doob đảm bảo rằng các ước lượng Bayesian nhất quán yếu (ngay cả trong mô hình số ít) trong cấu trúc liên kết yếu trong khi MLE phải đáp ứng một số yêu cầu nhất định trong cùng một cấu trúc liên kết.
Chỉ một từ, [Watanabe] không dành cho người mới bắt đầu. Nó có một số ý nghĩa sâu sắc đối với các bộ phân tích thực đòi hỏi sự trưởng thành toán học nhiều hơn hầu hết các nhà thống kê, vì vậy có lẽ không nên đọc nó nếu không có hướng dẫn thích hợp.
■
[Watanabe] Watanabe, Sumio. Hình học đại số và lý thuyết học thống kê. Tập 25. Nhà xuất bản Đại học Cambridge, 2009.
[Huber] Huber, Peter J. "Hành vi của ước tính khả năng tối đa trong điều kiện không đạt tiêu chuẩn." Kỷ yếu của hội nghị chuyên đề Berkeley thứ năm về thống kê và xác suất toán học. Tập 1. Số 1. 1967.
[Doob] Doob, Joseph L. "Ứng dụng lý thuyết của martingales." Le tính des probabilites et ses application (1949): 23-27.