Tại sao Hàm phân phối tích lũy (CDF) xác định duy nhất một phân phối?


17

Tôi luôn được thông báo rằng CDF là duy nhất tuy nhiên PDF / PMF không phải là duy nhất, tại sao vậy? Bạn có thể đưa ra một ví dụ trong đó PDF / PMF không phải là duy nhất?


6
Liên quan đến tính độc đáo, bạn có thể suy nghĩ về sự khác biệt giữa PDF của phân phối đồng đều trên và phân phối đồng đều ở bên trong của nó, . Một bài tập thú vị khác - giải quyết câu hỏi liệu PDF có tồn tại hay không - là suy nghĩ về bản PDF của phân phối trên các số hữu tỷ sẽ như thế nào. Chẳng hạn, hãy để bất cứ khi nào 0 \ lt j2 ^ {- i} \ lt 1 , i \ ge 1j là số lẻ. [0,1](0,1)Pr(j2i)=212i0<j2i<1i1j
whuber

2
Không phải tất cả các bản phân phối thậm chí có PDF, hoặc có PMF, trong khi nhìn vào CDF sẽ đưa ra một cái nhìn thống nhất cho mọi thứ. Các biến liên tục có CDF trông mượt mà, các biến rời rạc có "cầu thang" và một số CDF được trộn lẫn.
Cá bạc

6
@Silverfish: ... và một số không có gì ở trên! :-)
hồng y

3
Để giải quyết tiêu đề (có lẽ hơi lỏng lẻo), CDF định nghĩa phân phối vì CDF (hoặc tương đương chỉ là DF / 'hàm phân phối'; "C" chỉ hoạt động để làm rõ đối tượng mà chúng ta đang nói đến) là thuật ngữ "Phân phối" theo nghĩa đen là nói đến; "D" là đầu mối trên phần đó. Đó là duy nhất theo sau "F" - các hàm có giá trị đơn, vì vậy nếu hai hàm phân phối giống hệt nhau thì đối tượng chúng xác định là giống nhau; nếu DF khác nhau ở bất cứ đâu thì điều họ định nghĩa sẽ khác ở những điểm đó. Đó có phải là tautology? Tôi nghĩ rằng nó là.
Glen_b -Reinstate Monica

4
@Glen_b Đó là tautological chỉ với trực giác được đào tạo. Hàm phân phối chỉ cung cấp xác suất có dạng trong khi toàn bộ phân phối chỉ định xác suất của biểu mẫu đối với các tập hợp có thể đo lường tùy ý Bạn phải hiển thị xác định phân phối. Như NicholasB chỉ ra, đó là vấn đề mở rộng một biện pháp trước từ một nửa vòng (của các khoảng thời gian nửa mở), , đến trường sigma Lebesgue đầy đủ và hiển thị độc nhất.FF(x)=Pr{ωΩ|X(ω)x}BR F μ ( ( a , b ] ) = F ( b ) - F ( a )Pr({ωΩ|X(ω)B}BRFμ((a,b])=F(b)F(a)
whuber

Câu trả lời:


13

Hãy để chúng tôi nhớ lại một số điều. Hãy là một không gian xác suất , Ω là tập hợp mẫu của chúng tôi, Một là chúng tôi σ -algebra, và P là một hàm xác suất xác định trên A . Một biến ngẫu nhiên là một hàm đo được X : Ohm R tức là X - 1 ( S ) A cho bất kỳ Lebesgue đo lường được tập hợp trong R . Nếu bạn không quen thuộc với khái niệm này thì mọi thứ tôi nói sau đó sẽ không có ý nghĩa gì.(Ω,A,P)ΩAσPAX:ΩRX1(S)AR

Bất cứ khi nào chúng ta có một biến ngẫu nhiên, , nó tạo ra một phép đo xác suất trên bằng cách đẩy phân loại. Nói cách khác, . Việc kiểm tra xem có phải là thước đo xác suất trên ? Chúng tôi gọi sự phân phối của .X:ΩRXRX(S)=P(X1(S))XRXX

Bây giờ liên quan đến khái niệm này là một cái gì đó gọi là hàm phân phối của một biến chức năng. Cho một biến ngẫu nhiên chúng tôi xác định . Các hàm phân phối có các thuộc tính sau:X:ΩRF(x)=P(Xx)F:R[0,1]

  1. liên tục đúng.F

  2. không giảmF

  3. F ( - ) = 0 .F()=1F()=0

Các biến ngẫu nhiên rõ ràng bằng nhau có cùng chức năng phân phối và phân phối.

Để đảo ngược quá trình và có được một biện pháp với chức năng phân phối nhất định là khá kỹ thuật. Giả sử bạn được cấp hàm phân phối . Xác định μ ( một , b ] = F ( b ) - F ( một ) Bạn phải chứng minh rằng. Μ là một thước đo về bán đại số của chu kỳ của ( một , b ] Sau đó bạn có thể áp dụng. Định lý mở rộng Carathéodory để mở rộng μ đến một biện pháp xác suất về R .F(x)μ(a,b]=F(b)F(a)μ(a,b]μR


4
Đây là một khởi đầu tốt cho một câu trả lời, nhưng có thể vô tình che khuất vấn đề trong tay một chút. Vấn đề chính dường như cho thấy hai biện pháp có cùng chức năng phân phối là trên thực tế là bằng nhau. Điều này đòi hỏi gì hơn là Dynkin của - λ lý và thực tế là bộ hình thức ( - , b ] tạo thành một π -Hệ thống mà tạo ra các Borel σ . -Algebra Rồi nonuniqueness có mật độ (giả sử nó tồn tại) có thể! được giải quyết và tương phản với những điều trên.πλ(,b]πσ
Đức hồng y

3
(Một phân minh nhỏ bổ sung: Các biến ngẫu nhiên thường được xác định theo thuật ngữ của bộ Borel thay vì bộ Lebesgue.) Tôi nghĩ với một số chỉnh sửa nhỏ, câu trả lời này sẽ trở nên khá rõ ràng. :-)
hồng y

@cardinal Mình nghĩ phân tích trước, xác suất thứ hai. Do đó, điều này có thể giải thích tại sao tôi thích nghĩ về các bộ Lebesgue. Trong cả hai trường hợp, nó không ảnh hưởng đến những gì đã nói.
Nicolas Bourbaki

4

Để trả lời yêu cầu ví dụ về hai mật độ có cùng tích phân (nghĩa là có cùng hàm phân phối), hãy xem xét các hàm này được xác định trên các số thực:

 f(x) = 1 ; when x is odd integer
 f(x) = exp(-x^2)  ; elsewhere

và sau đó;

 f2(x) = 1  ; when x is even integer
 f2(x) = exp(-x^2) ;  elsewhere

Chúng không bằng nhau ở tất cả x, nhưng cả hai mật độ cho cùng một phân phối, do đó mật độ không được xác định duy nhất bởi phân phối (tích lũy). Khi mật độ với một miền thực chỉ khác nhau trên một tập hợp các giá trị x có thể đếm được, thì các tích phân sẽ giống nhau. Phân tích toán học không thực sự dành cho người yếu tim hay đầu óc cụ thể.


0

Tôi không đồng ý với tuyên bố, "hàm phân phối xác suất không xác định duy nhất một thước đo xác suất", mà bạn nói trong câu hỏi mở đầu của mình. Nó không xác định duy nhất nó.

Đặt là hai hàm khối lượng xác suất. Nếu E f 1 = E f 2 Đối với bất kỳ thể đo lường được thiết lập E sau đó f 1 = f 2 gần như ở khắp mọi nơi. Điều này xác định duy nhất pdf (vì trong phân tích, chúng tôi không quan tâm nếu họ không đồng ý với một bộ số đo bằng 0).f1,f2:R[0,)

Ef1=Ef2
Ef1=f2

Chúng ta có thể viết lại tích phân trên vào, Trong đó g = f 1 - f 2 là một hàm có thể tích hợp.

Eg=0
g=f1f2

E={xR | g0}Eg=0g=0Ef1=f2EF={xR | g0}f1=f2Ff1=f2EF=R

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.