Do pdf và pmf và cdf có chứa cùng một thông tin không?


17

Do pdf và pmf và cdf có chứa cùng một thông tin không?

Đối với tôi, pdf cung cấp toàn bộ xác suất cho một điểm nhất định (về cơ bản là khu vực dưới xác suất).

Các pmf đưa ra xác suất của một điểm nhất định.

Các cdf đưa ra xác suất dưới một điểm nhất định.

Vì vậy, với tôi pdf và cdf có cùng thông tin, nhưng pmf thì không bởi vì nó đưa ra xác suất cho một điểm xtrên bản phân phối.

Câu trả lời:


25

Khi phân biệt được thực hiện giữa hàm xác suất và mật độ *, pmf chỉ áp dụng cho các biến ngẫu nhiên rời rạc, trong khi pdf áp dụng cho các biến ngẫu nhiên liên tục.

* phương pháp chính thức có thể bao gồm cả hai và sử dụng một thuật ngữ duy nhất cho chúng

Cdf áp dụng cho bất kỳ biến ngẫu nhiên nào, bao gồm cả các biến không có pdf và pmf.

nhập mô tả hình ảnh ở đây

( Phân phối hỗn hợp không phải là trường hợp phân phối duy nhất không có pdf hoặc pmf, nhưng đó là tình huống khá phổ biến - ví dụ: xem xét lượng mưa trong một ngày hoặc số tiền được trả trong các khiếu nại một chính sách bảo hiểm tài sản, một trong hai chính sách có thể được mô hình hóa bằng phân phối liên tục không lạm phát)

Cdf cho một biến ngẫu nhiên choP ( X x )XP(Xx)

Pmf cho một biến ngẫu nhiên rời rạc , cho .P ( X = x )XP(X=x)

Bản thân pdf không cung cấp xác suất , nhưng xác suất tương đối; phân phối liên tục không có xác suất điểm. Để có được xác suất từ ​​pdf, bạn cần tích hợp trong một khoảng thời gian - hoặc lấy chênh lệch của hai giá trị cdf.

Thật khó để trả lời câu hỏi "chúng có chứa cùng một thông tin không" bởi vì nó phụ thuộc vào ý của bạn. Bạn có thể chuyển từ pdf sang cdf (thông qua tích hợp) và từ pmf sang cdf (thông qua tổng hợp) và từ cdf sang pdf (thông qua sự khác biệt) và từ cdf sang pmf (thông qua sự khác biệt), vì vậy nếu tồn tại pmf hoặc pdf, nó chứa thông tin giống như cdf.


1
Glen, bạn có thể giúp bằng cách cung cấp một số tài liệu tham khảo nơi tôi có thể đọc về "pdf đưa ra xác suất tương đối" không? Điều đó rất thú vị và tôi không nhớ đã thấy nó trong sách của mình. Cảm ơn.
Alecos Papadopoulos

@Alecos Nó chỉ đơn giản một (có lẽ kém worded) giải thích về thực tế rằng trong khi không phải là một xác suất, vì là xác suất là trong , sau đó có thể được coi là tỷ lệ của xác suất mà một biến có mật độ nằm trong một khoảng cách rất nhỏ của so với tỷ lệ mà một biến có mật độ nằm trong cùng một khoảng. Theo nghĩa đó, nó thể hiện 'xác suất tương đối'. f ( x )f(x)( x , x + d x ) f ( x ) / g ( x ) f x gf(x)dx(x,x+dx)f(x)/g(x)fxg
Glen_b -Reinstate Monica

Tôi hiểu rồi. Nó chắc chắn có giá trị như một xấp xỉ của tỷ lệ xác suất, và chắc chắn có mặt trong các hàm mật độ thực nghiệm, nơi mọi thứ rời rạc bởi sự cần thiết.
Alecos Papadopoulos

10

PMF được liên kết với các biến ngẫu nhiên rời rạc, PDF với các biến ngẫu nhiên liên tục. Đối với bất kỳ loại ngẫu nhiên nào của biến ngẫu nhiên, CDF luôn tồn tại (và là duy nhất), được định nghĩa là Bây giờ, tùy thuộc vào tập hỗ trợ của biến ngẫu nhiên , mật độ (hoặc hàm khối lượng) không cần tồn tại. (Xem xét Hàm Cantor và Hàm Cantor , bộ được xác định đệ quy bằng cách xóa trung tâm 1/3 của khoảng đơn vị, sau đó lặp lại quy trình cho các khoảng (0, 1/3) và (2/3, 1), v.v. Hàm được định nghĩa là , nếu nằm trong tập hợp Cantor và giới hạn dưới lớn nhất trong Tập hợp Cantor nếuX C ( x ) = x x x C ( x ) = 0 x < 0 C ( x ) = 1 1 < x C ( x )

FX(x)=P{Xx}.
XC(x)=xxxkhông phải là thành viên.) Hàm Cantor là một hàm phân phối hoàn toàn tốt, nếu bạn xử lý nếu và nếu . Nhưng cdf này không có mật độ: liên tục ở mọi nơi nhưng đạo hàm của nó là 0 gần như ở mọi nơi. Không có mật độ liên quan đến bất kỳ biện pháp hữu ích.C(x)=0x<0C(x)=11<xC(x)

Vì vậy, câu trả lời cho câu hỏi của bạn là, nếu mật độ hoặc hàm khối lượng tồn tại, thì đó là một dẫn xuất của CDF đối với một số biện pháp. Theo nghĩa đó, họ mang thông tin "giống nhau". NHƯNG, PDF và PMF không phải tồn tại. CDF phải tồn tại.


2
Dennis, bạn có thể làm rõ ý của bạn bằng cụm từ " Không có mật độ liên quan đến bất kỳ biện pháp nào không"? Chắc chắn nó có mật độ (đồng phục!) Đối với chính nó.
Đức hồng y

@cardinal: Tôi sẽ thử, nhưng tôi không biết rằng nó sẽ có ý nghĩa trừ khi bạn nghiên cứu một số phân tích thực sự. Nếu bạn xem một số sách cũ về thống kê toán học (ví dụ: Thống kê toán học của Freund ), bạn sẽ thấy các PMF được gọi là "mật độ". Tên "mật độ" được chứng minh bằng thước đo xác suất trên không gian đo được là cơ sở của CDF (xem bình luận của Joel). Mật độ là dẫn xuất Radon-Nikodym của đối với một số biện pháp (thường là biện pháp Lesbesgue hoặc biện pháp đếm). Trong trường hợp này, không có đạo hàm RN. ( Ω , σ ( Ω ) , μ ) μ C ( x )μ(Ω,σ(Ω),μ)μC(x)
Dennis

3
@cardinal (tiếp theo): Thước đo xác suất là đồng nhất trên Tập hợp Cantor, nhưng đây là một con thú kỳ lạ đến nỗi tôi thậm chí không chắc chắn -đau khớp trông như thế nào. Có lẽ tôi nên nói, "Không có mật độ liên quan đến bất kỳ biện pháp hữu ích nào." σ
Dennis

2

Các câu trả lời khác chỉ ra thực tế rằng CDF là cơ bản và phải tồn tại, trong khi PDF và PMF không phải và không nhất thiết tồn tại.

Điều này làm tôi bối rối và tò mò (là một người không thống kê), vì tôi không biết làm thế nào để giải thích CDF (hoặc làm thế nào nó có thể tồn tại) khi không gian mẫu không được đặt hàng; nghĩ, ví dụ, của vòng tròn .S1

Dường như với tôi rằng câu trả lời là hàm cơ bản là thước đo xác suất , ánh xạ từng tập hợp con (được coi là) của không gian mẫu thành một xác suất. Sau đó, khi chúng tồn tại, CDF, PDF và PMF phát sinh từ thước đo xác suất.


1
Theo cách tôi đã thấy, hầu hết các sách văn bản định nghĩa "biến ngẫu nhiên" là ánh xạ từ một không gian mẫu đến các số thực. Về cơ bản, một "biến ngẫu nhiên" có giá trị thực.
Neil G

1
Chúng tôi sử dụng các biến ngẫu nhiên để vào không gian xác suất và tránh xa . có thể có hoặc không được sắp xếp tốt, và điều đó làm cho nó trở thành một nỗi đau để giải quyết. Tôi cho rằng bạn đúng rằng là cơ bản hơn: sau tất cả, Nhưng thật khó để làm nhiều điều thú vị với không gian đo trừu tượng. Trên hết, các sinh viên của tôi có đủ vấn đề với PxF và CDF. Tôi không quan tâm đến việc cố gắng dạy họ đo lường lý thuyết. ( Ω , σ ( Ω ) , μ ) Ω μ F X ( x ) = μ { ω(R,B,F)(Ω,σ(Ω),μ)Ωμ
FX(x)=μ{ω|X(ω)x}.
Dennis
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.