Hàm nghịch đảo của phương sai

9

Đối với một số không đổi (ví dụ 4) đã cho, có thể tìm phân phối xác suất cho , để chúng ta có ? $r$ $X$ $\mathrm{Var}(X)=r$

distributions mathematical-statistics variance

— amiref
nguồn

1

Không, trừ khi bạn có thêm thông tin.

— Hemant Rupani

@Hemant Rupani cần thêm thông tin gì?

— amiref

1

bất kỳ bản chất của biến ngẫu nhiên 'X'

— Hemant Rupani

3

Tôi khuyên bạn nên chỉnh sửa câu hỏi của mình để thay thế "giá trị cho X" bằng "phân phối cho X" - nếu X chỉ có một giá trị duy nhất, thì X có phân phối suy biến và sẽ có phương sai bằng không.

— Cá bạc

1

Trừ khi là âm, câu trả lời rõ ràng là có, phương sai có thể là bất kỳ số dương nào.

r

$r$

— DSaxton

13

$r$ $r=0$ $X$ $\Pr(X=\mu)=1$ $\Pr(X=c)=0$ $c \neq \mu$ $X$ $\mu \in \mathbb{R}$

Nếu , không thể tìm thấy phân phối, vì . $r<0$ $\mathrm{Var}(X)=\mathbb{E}(X-\mu_X)^2 \geq 0$

Đối với , câu trả lời sẽ phụ thuộc vào những gì có thêm thông tin được biết về . Ví dụ: nếu được biết là có nghĩa là , thì với bất kỳ và chúng ta có thể tìm thấy một bản phân phối với những khoảnh khắc này bằng cách lấy . Đây không phải là một giải pháp duy nhất cho vấn đề khớp trung bình và phương sai, nhưng nó là giải pháp phân phối thông thường duy nhất (và trong tất cả các giải pháp có thể, đây là giải pháp tối đa hóa entropy, như Daniel chỉ ra). Nếu bạn cũng muốn khớp, ví dụ: thời điểm trung tâm thứ ba hoặc cao hơn, thì bạn sẽ cần xem xét phạm vi phân phối xác suất rộng hơn. $r>0$ $X$ $X$ $\mu$ $\mu \in \mathbb{R}$ $r>0$ $X \sim N(\mu, r)$

Giả sử thay vào đó chúng tôi đã có một số thông tin về phân phối thay vì khoảnh khắc của nó. Ví dụ: nếu chúng ta biết rằng tuân theo phân phối Poisson thì giải pháp duy nhất sẽ là . Nếu chúng ta biết rằng tuân theo phân phối theo cấp số nhân, thì một lần nữa, có một giải pháp duy nhất , trong đó chúng ta đã tìm thấy tham số bằng cách giải . $X$ $X$ $X \sim \mathrm{Poisson}(r)$ $X$ $X \sim \mathrm{Exponential}(\frac{1}{\sqrt{r}})$ $\mathrm{Var}(X) = r = \frac{1}{\lambda^2}$

Trong các trường hợp khác, chúng ta có thể tìm thấy cả một gia đình của các giải pháp. Nếu chúng ta biết rằng tuân theo phân phối hình chữ nhật (thống nhất liên tục), thì chúng ta có thể tìm thấy chiều rộng duy nhất cho phân phối bằng cách giải . Nhưng sẽ có cả một nhóm giải pháp, được tham số hóa bởi - các bản phân phối trong bộ này là tất cả các bản dịch của nhau. Tương tự, nếu bình thường thì mọi phân phối sẽ hoạt động (vì vậy chúng tôi có cả bộ giải pháp được lập chỉ mục bởi , một lần nữa có thể là bất kỳ số thực nào và một lần nữa gia đình đều là bản dịch của nhau). Nếu $X$ $w$ $\mathrm{Var}(X) = r = \frac{w^2}{12}$ $X \sim U(a, a+w)$ $a \in \mathbb{R}$ $X$ $X \sim N(\mu, r)$ $\mu$ $X$ theo phân phối gamma sau đó, bằng cách sử dụng tham số hóa tỷ lệ hình dạng, chúng ta có thể có được cả một nhóm giải pháp, được tham số hóa bởi . Các thành viên của gia đình này không phải là bản dịch của nhau. Để giúp hình dung một "họ giải pháp" trông như thế nào, đây là một số ví dụ về phân phối bình thường được lập chỉ mục bởi , và sau đó phân phối gamma được lập chỉ mục bởi , tất cả đều có phương sai bằng bốn, tương ứng với ví dụ trong câu hỏi của bạn. $X \sim \mathrm{Gamma}(\frac{r}{\theta^2}, \theta)$ $\theta > 0$ $\mu$ $\theta$ $r=4$

Phân phối bình thường với phương sai bốn Phân phối gamma với phương sai bốn

Mặt khác, đối với một số phân phối, có thể hoặc không thể tìm ra giải pháp, tùy thuộc vào giá trị của . Chẳng hạn, nếu phải là biến Bernoulli thì với có hai giải pháp khả thi vì có hai xác suất giải phương trình và trên thực tế hai xác suất này là bổ sung, tức là . Với chỉ có giải pháp duy nhất và với không có phân phối Bernoulli nào có phương sai đủ cao. $r$ $X$ $0 \leq r \lt 0.25$ $X \sim \mathrm{Bernoulli}(p)$ $p$ $\mathrm{Var}(X) = r = p(1-p)$ $p_1 + p_2 = 1$ $r=0.25$ $p=0.5$ $r>0.25$

Tôi cảm thấy tôi cũng nên đề cập đến trường hợp . Có nhiều giải pháp cho trường hợp này cũng vậy, ví dụ như một sinh viên phân phối với hai bậc tự do. $r = \infty$ $t$

Mã R cho các ô

require(ggplot2)

x.df  <- data.frame(x = rep(seq(from=-8, to=8, length=100), times=5),
    mu = rep(c(-4, -2, 0, 2, 4), each=100))
x.df$pdf <- dnorm(mean=x.df$mu, x.df$x)
ggplot(x.df, aes(x=x, y=pdf, group=factor(mu), colour=factor(mu))) + theme_bw() + 
    geom_line(size=1) + scale_colour_brewer(name=expression(mu), palette="Set1") +
    theme(legend.key = element_blank()) + ggtitle("Normal distributions with variance 4")

x.df  <- data.frame(x = rep(seq(from=0, to=20, length=1000), times=5),
    theta = rep(c(0.25, 0.5, 1, 2, 4), each=1000))
x.df$pdf <- dgamma(x.df$x, shape=4/(x.df$theta)^2, scale=x.df$theta)
ggplot(x.df, aes(x=x, y=pdf, group=factor(theta), colour=factor(theta))) + theme_bw() + 
    geom_line(size=1) + scale_colour_brewer(name=expression(theta), palette="Set1") +
    theme(legend.key = element_blank()) + ggtitle("Gamma distributions with variance 4") +
    coord_cartesian(ylim = c(0, 1))

— Cá bạc
nguồn

17

Giả sử bạn có nghĩa là "có thể tìm phân phối xác suất cho " thì câu trả lời là có, vì bạn chưa chỉ định bất kỳ tiêu chí nào mà phải đáp ứng. Trong thực tế, có vô số phân phối có thể đáp ứng điều kiện này. Chỉ cần xem xét sự phân bố bình thường, . Bạn có thể đặt và có thể nhận bất kỳ giá trị nào bạn thích - sau đó bạn sẽ có theo yêu cầu. $X$ $X$ $\mathcal{N}(x ; \mu, \sigma^2)$ $\sigma^2 = r$ $\mu$ $Var[X] = r$

Trong thực tế, phân phối chuẩn khá đặc biệt về vấn đề này vì đây là phân phối xác suất entropy tối đa cho một giá trị trung bình và phương sai nhất định.

— Daniel
nguồn

bạn nói đúng, tôi đã sửa nó bạn vui lòng giải thích thêm?

— amiref

@AmirEf Điều gì không rõ ràng?

— Daniel

6

Không rõ ràng những gì Daniel nên giải thích; câu trả lời ở đây dường như để giải quyết mọi thứ trong câu hỏi được đăng của bạn.

— Glen_b -Reinstate Monica

15

Câu hỏi này có thể được giải thích theo cách làm cho nó thú vị và không hoàn toàn tầm thường. Với một cái gì đó là vẻ bề ngoài giống như một biến ngẫu nhiên, đến mức độ nào là nó có thể xác suất assign để giá trị của nó (hoặc thay đổi xác suất tồn tại xung quanh) theo cách như vậy mà đúng của nó tương đương với một số số định trước ? Câu trả lời là tất cả các giá trị có thể được cho phép, lên đến một giới hạn xác định bởi phạm vi của . $X$ $r$ $r\ge 0$ $X$

Lợi ích tiềm năng trong phân tích như vậy nằm ở ý tưởng thay đổi thước đo xác suất, trong khi vẫn giữ một biến ngẫu nhiên cố định, để đạt được một kết thúc cụ thể. Mặc dù ứng dụng này rất đơn giản, nhưng nó hiển thị một số ý tưởng nằm dưới định lý Girsanov , một kết quả cơ bản trong tài chính toán học.

Chúng ta hãy đặt lại câu hỏi này một cách nghiêm ngặt, rõ ràng. Giả sử

X : (Ω, S) \to R

$X:(\Omega, \mathfrak{S}) \to \mathbb{R}$

là một hàm đo được xác định trên một không gian đo với sigma-đại số . Với một số thực , khi nào có thể tìm thấy số đo xác suất trên không gian này mà ? $\Omega$ $\mathfrak{S}$ $r \gt 0$ $\mathbb{P}$ $\text{Var}(X) = r$

Tôi tin rằng câu trả lời là đây là có thể khi . $\sup(X) - \inf(X) \gt 2\sqrt{r}$ (Bình đẳng có thể giữ nếu supremum và infimum đều đạt: đó là, họ thực sự là những tối đa và tối thiểu của.) Khi một trong haihoặc, tình trạng này không áp đặt giới hạn về, và sau đó tất cả các giá trị không âm của phương sai là có thể. $X$ $\sup(X)=\infty$ $\inf(X)=-\infty$ $r$

Bằng chứng là bằng cách xây dựng. Hãy bắt đầu với một phiên bản đơn giản của nó, để quan tâm đến các chi tiết và xác định ý tưởng cơ bản, sau đó chuyển sang xây dựng thực tế.

Hãy có trong hình ảnh của : phương tiện này có một mà . Xác định hàm đặt là chỉ số của : nghĩa là nếu và khi $x$ $X$ $\omega_x\in\Omega$ $X(\omega_x) = x$ $\mathbb{P}:\mathfrak{S}\to [0,1]$ $\omega_x$ $\mathbb{P}(A) = 0$ $\omega_x\notin A$ $\mathbb{P}(A) = 1$ . $\omega_x\in A$

Kể từ khi , rõ ràng thỏa mãn hai tiên đề đầu tiên của xác suất . Nó là cần thiết để hiển thị nó đáp ứng thứ ba; cụ thể, đó là phụ gia sigma. Nhưng điều này là gần như là hiển nhiên: bất cứ khi nào là một hữu hạn hoặc vô hạn đếm được tập các sự kiện loại trừ lẫn nhau, sau đó hoặc là không ai trong số chúng chứa --Trong trường hợp đó cho tất cả $\mathbb{P}(\Omega)=1$ $\mathbb P$ $\{E_i, i=1, 2, \ldots\}$ $\omega_x$ $\mathbb{P}(E_i)=0$ $i$ - hoặc chính xác một trong số chúng chứa , trong trường hợp này đối với một số cụ thể và nếu không cho tất cả . Trong cả hai trường hợp $\omega_x$ $\mathbb{P}(E_j)=1$ $j$ $\mathbb{P}(E_i)=0$ $i\ne j$

$P (\cup_{i} E_{i}) = \sum_{i} P (E_{i})$ $\mathbb{P}\left(\cup_i E_i\right) = \sum_i \mathbb{P}(E_i)$
bởi vì cả hai bên đều là hoặc cả . $0$ $1$

Vì tập trung tất cả xác suất vào , nên phân phối của tập trung vào và phải có phương sai bằng không. $\mathbb{P}$ $\omega_x$ $X$ $x$ $X$
Hãy là hai giá trị trong phạm vi của ; có nghĩa là, và . Theo cách tương tự như bước trước, xác định số đo là trung bình có trọng số của các chỉ số và . Sử dụng trọng số không âm và để được xác định. Cũng như trước đây, chúng tôi thấy rằng $x_1 \le x_2$ $X$ $X(\omega_1) = x_1$ $X(\omega_2) = x_2$ $\mathbb{P}$ $\omega_1$ $\omega_2$ $1-p$ $p$ $p$ $\mathbb{P}$ - có sự kết hợp lồi của các biện pháp chỉ thị được thảo luận trong (1) - là một biện pháp xác suất. Phân phối của liên quan đến biện pháp này là phân phối Bernoulli đã được chia tỷ lệ theo và được thay đổi bởi . Vì phương sai của phân phối Bernoulli là , nên phương sai của phải là $X$ $(p)$ $x_2-x_1$ $-x_1$ $(p)$ $p(1-p)$ $X$ . $(x_2-x_1)^2p(1-p)$

Một hệ quả trực tiếp của (2) là bất kỳ mà có tồn tại trong khoảng và mà $r$ $x_1 \le x_2$ $X$ $0 \le p \lt 1$

r = (x_{2} - x_{1})^{2} p (1 - p)

$r = (x_2-x_1)^2p(1-p)$

có thể là phương sai của . Kể từ , điều này ngụ ý $X$ $0 \le p(1-p) \le 1/4$

2 \sqrt{r} = \sqrt{4 r} \leq \sqrt{\frac{r}{p (1 - p)}} = \sqrt{(x_{2} - x_{1})^{2}} = x_{2} - x_{1} \leq sup (X) - inf (X),

$2\sqrt{r} = \sqrt{4 r} \le \sqrt{\frac{r}{p(1-p)}} = \sqrt{(x_2-x_1)^2} = x_2-x_1 \le \sup(X)-\inf(X),$

giữ bình đẳng khi và chỉ khi có cực đại và cực tiểu. $X$

Ngược lại, nếu vượt này ràng buộc của , sau đó không có giải pháp là có thể, vì chúng ta đã biết rằng phương sai của bất kỳ biến ngẫu nhiên bị chặn không thể vượt quá một phần tư bình phương của nó phạm vi. $r$ $(\sup(X)-\inf(X))^2/4$

— whuber
nguồn

3

Anh bạn, tôi nghĩ bạn ở một cấp độ hoàn toàn khác so với OP.

— Mark L. Stone

4

@Mark Có lẽ. (Tôi nghĩ rằng bạn đã phát hiện ra một sự hài hước rất khô khan ở đây.) Nhưng bất cứ ai áp dụng thẻ thống kê toán học vào bài đăng của họ đều phải mong đợi loại công cụ này :-).

— whuber

2

Nó làm tôi nhớ đến khi tôi học 4 lớp từ Giáo sư Samuel Karlin (của Karlin và Taylor nổi tiếng trong số những thứ khác) về "Tích cực toàn diện". Chủ đề của lý thuyết trò chơi bằng cách nào đó đã đưa ra. Ông nói, ồ, lý thuyết trò chơi. Bạn có hai biện pháp hữu hạn không tiêu cực ...., Bây giờ hãy tưởng tượng anh ấy giới thiệu lý thuyết trò chơi theo cách này cho sinh viên trong một lớp kinh tế học năm nhất tại một trường đại học nghệ thuật tự do. Đó là những gì bài viết của bạn làm tôi nghĩ đến.

— Mark L. Stone

@Mark Hiểu. Một người sẽ không làm điều đó và thành công. Như bạn chỉ ra, tôi viết ở đây cho (một tập hợp con) các độc giả nói chung chứ không phải là một cụ thể. Mặt khác, môn học trừu tượng không khó (ở cấp tiểu học này) và đã được chứng minh là có thể truy cập được đối với những học sinh lớp dưới có động lực tại các trường đại học nghệ thuật tự do. Xem các bình luận tại stats.stackexchange.com/a/94876 chẳng hạn.

— whuber

4

@ MarkL.Stone Câu trả lời không chỉ dành cho người hỏi ngay lập tức (SE dự định là kho lưu trữ các câu hỏi hay và câu trả lời tốt có giá trị cho những người sau này có câu hỏi tương tự) và chúng tôi đã có câu trả lời cho quan điểm cơ bản hơn về câu hỏi ở đây . Một số độc giả khác có thể nhận được một cái gì đó từ những điều cơ bản ít hơn, vì vậy một loạt các phong cách và mức độ trả lời làm cho câu hỏi hữu ích cho nhiều người hơn.

— Glen_b -Reinstate Monica

10

Vâng, có thể tìm thấy phân phối như vậy. Trong thực tế, bạn có thể lấy bất kỳ phân phối nào có phương sai hữu hạn và tỷ lệ phù hợp với điều kiện của bạn, bởi vì

V a r [c X] = c^{2} V a r [X]

$Var[cX]=c^2Var[X]$

Chẳng hạn, phân phối đồng đều trên khoảng có phương sai: $[0,1]$ Do đó, phân phối đồng đều trong khoảng

σ^{2} = \frac{1}{12}

$\sigma^2=\frac{1}{12}$

sẽ có phương sai

.

[0, \frac{1}{\sqrt{12 r}}]

$\left[0,\frac{1}{\sqrt{12r}}\right]$

r

$r$

Trong thực tế, đây là một cách phổ biến để thêm tham số vào một số bản phân phối, chẳng hạn như Student t. Nó chỉ có một tham số, - độ tự do. Khi phân phối hội tụ đến một tiêu chuẩn bình thường. Nó có hình chuông, và trông rất giống bình thường, nhưng có đuôi béo hơn. Đó là lý do tại sao nó thường được sử dụng thay thế cho phân phối bình thường khi đuôi mập. Vấn đề duy nhất là phân phối Gaussian có hai tham số. Vì vậy, đến phiên bản thu nhỏ của Student t, đôi khi được gọi là phân phối "tỷ lệ vị trí t" . Đây là một chuyển đổi rất đơn giản: $\nu$ $\nu\to\infty$ , trong đólà vị trí và tỷ lệ. Bây giờ, bạn có thể thiết lập các quy mô để các biến mớisẽ có bất kỳ sai yêu cầu, và sẽ có một hình dạng của phân phối t Student. $\xi=\frac{t-\mu}{s}$ $\mu,s$ $\xi$

— Aksakal
nguồn