Là CDF cơ bản hơn PDF?


43

Stat của tôi về cơ bản đã nói, nếu được đưa ra một trong ba điều sau đây, bạn có thể tìm thấy hai điều còn lại:

  • Chức năng phân phối tích lũy
  • Chức năng tạo khoảnh khắc
  • Hàm mật độ xác suất

Nhưng giáo sư kinh tế lượng của tôi nói rằng CDF cơ bản hơn PDF vì có những ví dụ bạn có thể có CDF nhưng PDF không được xác định.

Là CDF cơ bản hơn PDF? Làm cách nào để biết liệu PDF hoặc MGF có thể được lấy từ CDF không?


23
Đây có phải là một số loại cuộc thi cơ bản? Chúng ta có một hội đồng xét xử người nổi tiếng? Tất cả ba khái niệm này có thể được sử dụng để xác định một số đo trên một khoảng . Tuy nhiên, đối với một CDF nhất định, MGF và PDF có thể không tồn tại, vì PDF được định nghĩa là một dẫn xuất của CDF và MGF được định nghĩa là một và điều này không thể thiếu không tồn tại. Tuy nhiên điều này không có nghĩa là bất kỳ khái niệm nào trong số này là ít cơ bản. Cơ bản là một tính từ tốt đẹp không có định nghĩa toán học. Đó là một từ đồng nghĩa quan trọng. R exp(tx)dF(x)RCười mở miệngRexp(tx)dF(x)
mpiktas

6
@mpiktas: Mọi phân phối xác suất trên (một tập hợp con) đều có CDF và nó xác định duy nhất phân phối. Tuy nhiên, không phải tất cả các bản phân phối xác suất đều có PDF hoặc MGF (nhưng tất cả chúng đều có chức năng đặc trưng ). Rviết sai rồi
Ilmari Karonen

3
@mpiktas Bạn có thể làm điều đó với trên . Sau đó, không được xác định. Tuy nhiên, rõ ràng với tôi tại sao giáo sư sử dụng biểu thức "cơ bản hơn". Tính từ có thể không có ý nghĩa toán học được xác định rõ, nhưng vậy thì sao? một số) Tiếng Anh cũng vậy. Mỗi bản PDF mà chúng tôi biết đều có CDF cơ bản. Ở đây "bên dưới" có mối liên hệ tốt với "cơ bản". Điều ngược lại là không đúng.R P ( ( - , x ] )Một= ={R,}RP((-,x])
drhab

2
@drhab, tự nhiên tôi đã nói về đạo hàm Radon-Nikodym :) Tôi hoàn toàn hiểu giáo sư nghĩ gì, nhưng theo tôi, thật nguy hiểm khi sử dụng các biểu thức như vậy với sinh viên, vì sau đó thay vì cố gắng hiểu sự khác biệt giữa Các khái niệm toán học họ cố gắng xếp hạng chúng theo nguyên tắc cơ bản, đó là sai cơ bản. Pun dự định.
mpiktas

4
@mpiktas: chắc chắn, không có định nghĩa chính xác về cơ bản. Nhưng có một nền tảng trung gian lớn giữa các khu vực được xác định nghiêm ngặt và thành công và hoàn toàn vô nghĩa. Tất nhiên, trong chính toán học của chúng ta, tất cả mọi thứ cuối cùng phải hoàn toàn nghiêm ngặt, vì vậy chúng ta đã rất quen với việc tát bất cứ thứ gì không có. Nhưng khi chúng ta nói và suy nghĩ về toán học, chúng ta cũng có những khái niệm chủ quan nhưng vẫn có ý nghĩa như là cơ bản,, nói chung, v.v., cũng giống như mọi người khác; và đó là OK.
PLL

Câu trả lời:


69

Mỗi phân phối xác suất trên (một tập hợp con) hàm phân phối tích lũy và nó xác định duy nhất phân phối. Vì vậy, theo nghĩa này, CDF thực sự là cơ bản như chính bản phân phối.Rviết sai rồi

Một hàm mật độ xác suất , tuy nhiên, chỉ tồn tại cho (hoàn toàn) phân bố xác suất liên tục . Ví dụ đơn giản nhất về phân phối thiếu PDF là bất kỳ phân phối xác suất rời rạc nào , chẳng hạn như phân phối biến ngẫu nhiên chỉ lấy các giá trị nguyên.

Tất nhiên, thay vào đó, các phân phối xác suất rời rạc như vậy có thể được đặc trưng bởi hàm khối xác suất , nhưng cũng có các phân phối không có và PDF hoặc PMF, chẳng hạn như bất kỳ hỗn hợp nào của phân phối liên tục và rời rạc:

Sơ đồ phân phối xác suất liên tục, rời rạc và hỗn hợp
(Sơ đồ bị đánh cắp một cách đáng xấu hổ từ câu trả lời của Glen_b cho một câu hỏi liên quan.)

Thậm chí có những phân phối xác suất đơn lẻ , chẳng hạn như phân phối Cantor , không thể được mô tả ngay cả khi kết hợp PDF và PMF. Các bản phân phối như vậy vẫn có CDF được xác định rõ, mặc dù. Ví dụ, đây là CDF của bản phân phối Cantor, đôi khi còn được gọi là "cầu thang của quỷ":

CDF phân phối Cantor
( Hình ảnh từ Wikimedia Commons của người dùng TheonAmirki , được sử dụng theo giấy phép CC-By-SA 3.0 .)

CDF, được gọi là chức năng Cantor , liên tục nhưng không hoàn toàn liên tục. Trên thực tế, nó không đổi ở mọi nơi ngoại trừ trên tập hợp Cantor của số đo Lebesgue bằng 0, nhưng vẫn chứa vô số điểm. Do đó, toàn bộ khối lượng xác suất của phân phối Cantor tập trung vào tập con nhỏ biến mất này của dòng số thực, nhưng mọi điểm trong tập hợp vẫn riêng lẻ có xác suất bằng không.


Cũng có những phân phối xác suất không có chức năng tạo thời điểm . Có lẽ ví dụ được biết đến nhiều nhất là phân phối Cauchy , phân phối có đuôi không có thời điểm xác định rõ thứ tự 1 hoặc cao hơn (đặc biệt, không có giá trị trung bình hoặc phương sai được xác định rõ!).

Tuy nhiên, tất cả các phân phối xác suất trên đều có hàm đặc trưng (có thể có giá trị phức tạp ), có định nghĩa khác với MGF chỉ bằng phép nhân với đơn vị tưởng tượng . Do đó, chức năng đặc trưng có thể được coi là cơ bản như CDF.Rviết sai rồi


Bạn nói rằng mọi bản phân phối đều có CDF, nhưng không phải bản nào cũng có PDF, nhưng thực tế có bản phân phối có tệp PDF và không có CDF dạng đóng, ví dụ như đa biến thông thường.
Tim

13
@Tim: Điều đó đúng, nhưng chỉ với vòng loại "dạng đóng"; CDF vẫn tồn tại, ngay cả khi chúng ta không thể viết nó ở dạng đóng. Và trong mọi trường hợp, định nghĩa của " biểu thức dạng đóng " nổi tiếng là mờ nhạt; theo một số định nghĩa nghiêm ngặt, ngay cả phân phối bình thường đơn biến cũng không có CDF dạng đóng, nhưng nếu bạn coi hàm lỗi là dạng đóng, thì nó có.
Ilmari Karonen

11
@Tim Đây không phải là một ví dụ ngược lại. Đó là một tài sản tùy ý mà bạn chọn là quan trọng / cơ bản đối với bạn. Đối với tôi, tài sản "tồn tại" quan trọng hơn "hình thức đóng". Hơn nữa, "luôn tồn tại" so với "đôi khi có thể không có dạng đóng, giống như bất kỳ chức năng nào".
Ark-kun

3
[0,1]R

1
@ Ark-kun Tôi đang chơi quỷ ủng hộ ở đây vì có những trường hợp PDF là thứ gì đó "có sẵn trực tiếp" hơn CDF. Tôi thích câu trả lời này (+1), nhưng IMHO, đây là điều cũng có thể được đề cập.
Tim

16

Tôi tin rằng giáo sư kinh tế lượng của bạn đã suy nghĩ một cái gì đó dọc theo các dòng sau.

ĐỤ[0,1]

ĐỤ(x)= =12x cho x<12
ĐỤ(x)= =12x+12 cho x12

[0,1]

P({12})= =12

đụ

đụ

Theo định nghĩa của PDF, chúng ta phải có

0xđụ(t)Cười mở miệngt= =ĐỤ(x)-ĐỤ(0)= =14x

0<x<12

đụ(x)= =14 cho x<12

x>12

đụ(x)= =14 cho x>12

đụđụ(12)đụ(12)

P({12})= =12

chúng ta sẽ cần

12-ε12+εđụ(t)Cười mở miệngt>12

12

12-ε12+εđụ(t)Cười mở miệngt= =12-ε12+ε14Cười mở miệngt= =12ε

đụ

Bạn có thể khôi phục tinh thần của PDF, nhưng bạn phải sử dụng các đối tượng toán học phức tạp hơn, hoặc là thước đo hoặc phân phối .


3
12δ(x-12)δ(x)x= =0
-+δ(x)Cười mở miệngx= =1

2
L1

@IwillnotexistIdonotexist Những gì whuber nói là những gì tôi đã gợi ý ở dòng cuối cùng. Tôi đã sử dụng từ "phân phối".
Matthew Drury

4
1/21/2

4

Ilmari đưa ra một câu trả lời tốt từ góc độ lý thuyết. Tuy nhiên, người ta cũng có thể hỏi mật độ (pdf) và chức năng phân phối (pdf) nhằm mục đích gì cho các tính toán thực tế. Điều này có thể làm rõ những tình huống nào hữu ích trực tiếp hơn tình huống khác.

R(-,x]--

Tuy nhiên, mật độ là cần thiết cho thống kê, vì khả năng được xác định theo mật độ. Do đó, nếu chúng ta muốn tính toán ước tính khả năng tối đa, chúng ta cần trực tiếp mật độ.

Nếu chúng ta chuyển sang so sánh phân phối theo kinh nghiệm và phân phối theo lý thuyết, cả hai đều có thể hữu ích, nhưng các phương pháp như pp- và qq-lô dựa trên hàm phân phối thường được ưa thích hơn.

RCười mở miệngCười mở miệng2

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.