Các định lý Halmos-Savage nói rằng đối với một mô hình thống kê chi phối một thống kê là đủ nếu (và chỉ khi) cho tất cả có phiên bản -measurable của đạo hàm Radon Nikodym $(\Omega, \mathscr A, \mathscr P)$ $T: (\Omega, \mathscr A, \mathscr P)\to(\Omega', \mathscr A')$ $\{P \in \mathscr{P} \}$ $T$ $\frac{dP}{dP*}$ nơi $dP*$ là một biện pháp đặc quyền như vậy màchovà. $P*=\sum_{i=1}^\infty P_i c_i$ $c_i >0, \sum _{i=1}^\infty c_i =1$ $P_i \in \mathscr P$

Tôi đã cố gắng để có được một nắm bắt trực quan tại sao định lý là đúng nhưng tôi đã không thành công, vì vậy câu hỏi của tôi là liệu có một cách trực quan để hiểu định lý.

— Sebastian
nguồn

Tôi tin rằng tôi có liên kết chính xác ở đây. Vui lòng kiểm tra và loại bỏ nó nếu tôi làm sai.

— gung - Phục hồi Monica

Có thể giúp người đọc với thuật ngữ, ví dụ: xác định "mô hình thống kê thống trị", "

T $T$ -measurability" và "biện pháp đặc quyền?

— Carl

Bổ đề kỹ thuật

Tôi không chắc nó trực quan đến mức nào, nhưng kết quả kỹ thuật chính nằm dưới tuyên bố của bạn về Định lý Halmos-Savage là như sau:

Bổ đề. Hãy $\mu$ là một $\sigma$ biện pháp -finite trên $(S, \mathcal{A})$ . Giả sử rằng $\aleph$ là một tập hợp các biện pháp trên $(S, \mathcal{A})$ như vậy mà cho mỗi $\nu \in \aleph$ , $\nu \ll \mu$ . Sau đó, có tồn tại một chuỗi các số không âm $\{c_i\}_{i=1}^\infty$ và một chuỗi các yếu tố của $\aleph$ , $\{\nu_i\}_{i=1}^\infty$ như vậy $\sum_{i=1}^\infty c_i = 1$ và $\nu \ll \sum_{i=1}^\infty c_i \nu_i$ cho mỗi $\nu \in \aleph$ .

Điều này được lấy nguyên văn từ Định lý A.78 trong Lý thuyết thống kê của Schervish (1995) . Trong đó, ông gán nó cho Giả thuyết thống kê thử nghiệm của Lehmann (1986) ( liên kết đến phiên bản thứ ba ), trong đó kết quả được quy cho Halmos và Savage (xem Bổ đề 7). Một tài liệu tham khảo tốt khác là Thống kê toán học của Shao (ấn bản thứ hai, 2003) , trong đó các kết quả có liên quan là Bổ đề 2.1 và Định lý 2.2.

Bổ đề trên tiểu bang rằng nếu bạn bắt đầu với một gia đình của các biện pháp khống chế bởi một $\sigma$ biện pháp -finite, sau đó trong thực tế, bạn có thể thay thế các biện pháp chiếm ưu thế bởi sự kết hợp lồi đếm được các biện pháp từ bên trong gia đình. Schervish viết trước khi nêu Định lý A.78,

"Trong các ứng dụng thống kê, chúng tôi sẽ thường có một lớp học của các biện pháp, mỗi trong số đó là hoàn toàn liên tục đối với một đơn với $\sigma$ biện pháp -finite. Nó sẽ được tốt đẹp nếu biện pháp chiếm ưu thế đơn là trong lớp ban đầu hoặc có thể được xây dựng từ lớp. Định lý sau đây giải quyết vấn đề này. "

Một ví dụ cụ thể

Giả sử chúng ta lấy một phép đo của đại lượng $X$ mà chúng tôi tin là phân bố đều trên khoảng $[0, \theta]$ đối với một số chưa biết $\theta > 0$ . Trong bài toán thống kê này, chúng ta mặc nhiên xem xét các thiết lập $\mathcal{P}$ các biện pháp khả Borel trên $\mathbb{R}$ bao gồm các phân phối đều liên tục trên tất cả các khoảng thời gian có dạng $[0, \theta]$ . Nghĩa là, nếu $\lambda$ biểu Lebesgue đo lường và, cho $\theta > 0$ , $P_\theta$ biểu thị $\operatorname{Uniform}([0, \theta])$ Phân phối (nghĩa là

P θ (A) = 1 θ λ (A \cap [0, θ]) = \int A 1 θ 1 [0, θ] (x) d x

$P_\theta(A) = \frac{1}{\theta} \lambda(A \cap [0, \theta]) = \int_A \frac{1}{\theta} \mathbf{1}_{[0, \theta]}(x) \, dx$ cho mỗi Borel

A⊆R $A \subseteq \mathbb{R}$ ), sau đó chúng tôi chỉ cần có

P = {P θ : θ > 0} .

$\mathcal{P} = \{P_\theta : \theta > 0\}.$ Đây là tập hợp các phân phối ứng cử viên cho phép đo

X $X$ của chúng tôi.

Gia đình $\mathcal{P}$ bị chi phối rõ ràng bởi Lebesgue đo $\lambda$ (được $\sigma$ -finite), vì vậy bổ đề trên (với $\aleph = \mathcal{P}$ ) đảm bảo sự tồn tại của một chuỗi $\{c_i\}_{i=1}^\infty$ số không âm cách tổng hợp để $1$ và dãy $\{Q_i\}_{i=1}^\infty$ bản phân phối thống nhất trong $\mathcal{P}$ mà

P θ ≪ \sum i = 1 \infty c i Q i

$P_\theta \ll \sum_{i=1}^\infty c_i Q_i$ với mỗi

θ>0 $\theta > 0$ . Trong ví dụ này, chúng ta có thể xây dựng các chuỗi như vậy một cách rõ ràng!

Trước tiên, hãy $(\theta_i)_{i=1}^\infty$ là một liệt kê các số hữu tỉ dương tính ( điều này có thể được thực hiện một cách rõ ràng ), và để cho $Q_i = P_{\theta_i}$ cho mỗi $i$ . Tiếp theo, hãy $c_i = 2^{-i}$ , do đó $\sum_{i=1}^\infty c_i = 1$ . Tôi cho rằng sự kết hợp này của $\{c_i\}_{i=1}^\infty$ và $\{Q_i\}_{i=1}^\infty$ tác phẩm.

Để thấy điều này, sửa chữa $\theta > 0$ và chúng ta hãy $A$ là tập con Borel của $\mathbb{R}$ mà $\sum_{i=1}^\infty c_i Q_i(A) = 0$ . Chúng tôi cần phải chứng minh rằng $P_\theta(A) = 0$ . Kể từ $\sum_{i=1}^\infty c_i Q_i(A) = 0$ và mỗi summand là không âm, nó sau đó $c_i Q_i(A) = 0$ cho mỗi $i$ . Hơn nữa, vì mỗi $c_i$ là dương, theo sau $Q_i(A) = 0$ cho mỗi $i$ . Đó là, cho tất cả $i$ chúng ta có

Q i (A) = P θ i (A) = 1 θ i λ (A \cap [0, θ i]) = 0.

$Q_i(A) = P_{\theta_i}(A) = \frac{1}{\theta_i} \lambda(A \cap [0, \theta_i]) = 0.$ Vì mỗi

θi $\theta_i$ là tích cực, nó sau đó

λ(A∩[0,θi])=0 $\lambda(A \cap [0, \theta_i]) = 0$ cho mỗi

i $i$ .

Bây giờ chọn một dãy $\{\theta_{i_k}\}_{k=1}^\infty$ của $\{\theta_i\}_{i=1}^\infty$ mà hội tụ để $\theta$ từ trên cao (điều này có thể được thực hiện kể từ khi $\mathbb{Q}$ là dày đặc trong $\mathbb{R}$ ). Rồi $A \cap [0, \theta_{\theta_{i_k}}] \downarrow A \cap [0, \theta]$ như $k \to \infty$ , do bởi tính liên tục của đo mà chúng tôi kết luận rằng

λ (A \cap [0, θ]) = lim k \to \infty λ (A \cap [0, θ i k]) = 0,

$\lambda(A \cap [0, \theta]) = \lim_{k \to \infty} \lambda(A \cap [0, \theta_{i_k}]) = 0,$ và do đó

Pθ(A)=0 $P_\theta(A) = 0$ . Điều này chứng tỏ yêu sách.

Thus, in this example we were able to explicitly construct a countable convex combination of probability measures from our dominated family which still dominates the entire family. The Lemma above guarantees that this can be done for any dominated family (at least as long as the dominating measure is $\sigma$ -finite).

The Halmos-Savage Theorem

So now on to the Halmos-Savage Theorem (for which I will use slightly different notation than in the question due to personal preference). Given the Halmos-Savage Theorem, the Fisher-Neyman factorization theorem is just one application of the Doob-Dynkin lemma and the chain rule for Radon-Nikodym derivatives away!

Định lý Halmos-Savage. Hãy $(\mathcal{X}, \mathcal{B}, \mathcal{P})$ là một mô hình thống kê chi phối (nghĩa là $\mathcal{P}$ là một tập hợp các biện pháp xác suất về $\mathcal{B}$ và có một $\sigma$ -finite đo $\mu$ trên $\mathcal{B}$ mà $P \ll \mu$ cho tất cả $P \in \mathcal{P}$ ). Đặt $T : (\mathcal{X}, \mathcal{B}) \to (\mathcal{T}, \mathcal{C})$ là một hàm đo được, trong đó $(T, \mathcal{C})$ is a standard Borel space. Then the following are equivalent:

$T$ is sufficient for $\mathcal{P}$ (meaning that there is a probability kernel $r : \mathcal{B} \times \mathcal{T} \to [0, 1]$ such that $r(B, T)$ is a version of $P(B \mid T)$ for all $B \in \mathcal{B}$ and $P \in \mathcal{P}$ ).

There exists a sequence $\{c_i\}_{i=1}^\infty$ of nonnegative numbers such that $\sum_{i=1}^\infty c_i = 1$ and a sequence $\{P_i\}_{i=1}^\infty$ of probability measures in $\mathcal{P}$ such that $P \ll P^*$ for all $P \in \mathcal{P}$ , where $P^* = \sum_{i=1}^\infty c_i P_i$ , and for each $P \in \mathcal{P}$ there exists a $T$ -measurable version of $dP/dP^*$ .

Proof. By the lemma above, we may immediately replace $\mu$ by $P^* = \sum_{i=1}^\infty c_i P_i$ for some sequence $\{c_i\}_{i=1}^\infty$ of nonnegative numbers such that $\sum_{i=1}^\infty c_i = 1$ and a sequence $\{P_i\}_{i=1}^\infty$ of probability measures in $\mathcal{P}$ .

(1. implies 2.) Suppose $T$ is sufficient. Then we must show that there are $T$ -measurable versions of $dP/dP^*$ for all $P \in \mathcal{P}$ . Let $r$ be the probability kernel in the statement of the theorem. For each $A \in \sigma(T)$ and $B \in \mathcal{B}$ we have

$\begin{aligned} P^*(A \cap B) &= \sum_{i=1}^\infty c_i P_i(A \cap B) \\ &= \sum_{i=1}^\infty c_i \int_A P_i(B \mid T) \, dP_i \\ &= \sum_{i=1}^\infty c_i \int_A r(B, T) \, dP_i \\ &= \int_A r(B, T) \, dP^*. \end{aligned}$ Thus

$r(B, T)$ is a version of

$P^*(B \mid T)$ for all

$B \in \mathcal{B}$ .

For each $P \in \mathcal{P}$ , let $f_P$ denote a version of the Radon-Nikodym derivative $dP/dP^*$ on the measurable space $(\mathcal{X}, \sigma(T))$ (so in particular $f_P$ is $T$ -measurable). Then for all $B \in \mathcal{B}$ and $P \in \mathcal{P}$ we have

$\begin{aligned} P(B) &= \int_{\mathcal{X}} P(B \mid T) \, dP \\ &= \int_{\mathcal{X}} r(B, T) \, dP \\ &= \int_{\mathcal{X}} r(B, T) f_P \, dP^* \\ &= \int_{\mathcal{X}} P^*(B \mid T) f_P \, dP^* \\ &= \int_{\mathcal{X}} E_{P^*}[\mathbf{1}_B f_P \mid T] \, dP^* \\ &= \int_B f_P \, dP^*. \end{aligned}$ Thus in fact

$f_P$ is a

$T$ -measurable version of

$dP/dP^*$ on

$(\mathcal{X}, \mathcal{B})$ . This proves that the first condition of the theorem implies the second.

(2. implies 1.) Suppose one can choose a $T$ -measurable version $f_P$ of $dP/dP^*$ for each $P \in \mathcal{P}$ . For each $B \in \mathcal{B}$ , let $r(B, t)$ denote a particular version of $P^*(B \mid T = t)$ (e.g., $r(B, t)$ is a function such that $r(B, T)$ is a version of $P^*(B \mid T)$ ). Since $(T, \mathcal{C})$ is a standard Borel space, we may choose $r$ in a way that makes it a probability kernel (see, e.g., Theorem B.32 in Schervish's Theory of Statistics (1995)). We will show that $r(B, T)$ is a version of $P(B \mid T)$ for any $P \in \mathcal{P}$ and any $B \in \mathcal{B}$ . Thus, let $A \in \sigma(T)$ and $B \in \mathcal{B}$ be given. Then for all $P \in \mathcal{P}$ we have

$\begin{aligned} P(A \cap B) &= \int_A \mathbf{1}_B f_P \, dP^* \\ &= \int_A E_{P^*}[\mathbf{1}_B f_P \mid T] \, dP^* \\ &= \int_A P^*(B \mid T) f_P \, dP^* \\ &= \int_A r(B, T) f_P \, dP^* \\ &= \int_A r(B, T) \, dP. \end{aligned}$ This shows that

$r(B, T)$ is a version of

$P(B \mid T)$ for any

$P \in \mathcal{P}$ and any

$B \in \mathcal{B}$ , and the proof is done.

Summary. The important technical result underlying the Halmos-Savage theorem as presented here is the fact that a dominated family of probability measures is actually dominated by a countable convex combination of probability measures from that family. Given that result, the rest of the Halmos-Savage theorem is mostly just manipulations with basic properties of Radon-Nikodym derivatives and conditional expectations.

— Artem Mavrin
nguồn

Hiểu biết trực quan về định lý Halmos-Savage

Bổ đề kỹ thuật

Một ví dụ cụ thể

The Halmos-Savage Theorem