Có phải Wolfram Mathworld mắc lỗi mô tả phân phối xác suất rời rạc với hàm mật độ xác suất?


14

Thông thường phân phối xác suất trên các biến rời rạc được mô tả bằng hàm khối xác suất (PMF):

Khi làm việc với các biến ngẫu nhiên liên tục, chúng tôi mô tả phân phối xác suất bằng cách sử dụng hàm mật độ xác suất (PDF) thay vì hàm khối lượng xác suất.

- Học sâu của Goodfellow, Bengio và Courville

Tuy nhiên, Wolfram Mathworld đang sử dụng PDF để mô tả phân phối xác suất trên các biến rời rạc:

nhập mô tả hình ảnh ở đây

Đây có phải là một sai lầm? hoặc nó không quan trọng?


5
Đó là cẩu thả, theo tôi, nhưng không quan trọng lắm. Nó thậm chí có thể phòng thủ được nếu họ tiếp cận xác suất theo quan điểm của lý thuyết đo lường, mặc dù điều đó có vẻ hơi nhiều đối với việc giới thiệu để lật một đồng xu. (Thật kỳ lạ, họ dường như không có một bài viết nào về PMF.)
Dave

9
một pmf là mật độ so với biện pháp đếm
Xi'an

3
Khi bạn thảo luận về lý thuyết xác suất ở mức không gian đo được chỉ định bởi 3 yếu tố, pdf và pmf không có gì khác nhau, do đó pmf bị loại bỏ. Tất cả các bản phân phối có thể được chỉ định bởi pdf. wolfram là một trang web toán học, vì vậy không có gì ngạc nhiên khi họ sử dụng toán cấp cao để nói về xác suất. Đây là đọc miễn phí tốt. stat.washington.edu/~pdhoff/cifts/581/LectureNotes/ từ
user158565

Câu trả lời:


30

Đó không phải là một sai lầm: Trong điều trị chính thức của xác suất, thông qua lý thuyết đo lường, hàm mật độ xác suất là một dẫn xuất của thước đo xác suất quan tâm, được thực hiện theo "thước đo thống trị" (còn gọi là "thước đo tham chiếu"). Đối với các phân phối rời rạc trên các số nguyên, hàm khối lượng xác suất là hàm mật độ liên quan đến phép đo . Vì hàm khối lượng xác suất là một loại hàm mật độ xác suất cụ thể, đôi khi bạn sẽ tìm thấy các tài liệu tham khảo như thế này gọi nó là hàm mật độ và chúng không sai khi nói về nó theo cách này.

Trong các diễn ngôn thông thường về xác suất và thống kê, người ta thường tránh thuật ngữ này và rút ra sự phân biệt giữa "các hàm khối lượng" (đối với các biến ngẫu nhiên rời rạc) và "hàm mật độ" (đối với các biến ngẫu nhiên liên tục), để phân biệt các phân phối rời rạc và liên tục. Trong các bối cảnh khác, nơi người ta nêu các khía cạnh tổng thể của xác suất, thường tốt hơn là bỏ qua sự khác biệt và gọi cả hai là "hàm mật độ".


Cảm ơn câu trả lời của bạn. Liệu treatment"Trong điều trị chính thức của xác suất" có nghĩa là ký hiệu, quan điểm, quy ước hay cái gì khác?
czlsws

Khi tôi nói ở đây về "đối xử chính thức", tôi đang đề cập đến cơ sở hiện đại của lý thuyết xác suất, đó là một tập hợp con của lý thuyết đo lường. Đó là lý thuyết toán học được chấp nhận là nền tảng chính thức của xác suất.
Phục hồi Monica

"Hàm mật độ xác suất là một đạo hàm của thước đo xác suất quan tâm" Đối với tôi, theo một nghĩa nào đó, nó giống như một "chống tích phân" hơn là một đạo hàm. Có các tệp PDF không liên tục, chẳng hạn như phân phối đồng đều và phân phối rời rạc có thể được coi là tổng của các hàm delta Dirac. Trong những trường hợp đó, người ta sẽ phải khái quát khái niệm về một công cụ phái sinh vượt xa sự hiểu biết thông thường để áp dụng nó.
Tích lũy

@Acccumulation - phân phối thống nhất không liên tục như thế nào? ... Và lý thuyết đo lường một cách xử lý tổng hợp và khác biệt hơn nhiều so với cách hiểu thông thường về Calc I và II cung cấp.
jbowman

@Accumulation: Vâng, đó là một đặc tính công bằng, và thực sự, đó là những gì được thực hiện. Về mặt kỹ thuật, mật độ là một dẫn xuất Radon-Nikodym , đây thực sự là một loại "chống tích phân" của loại bạn mô tả.
Phục hồi Monica

5

Ngoài câu trả lời lý thuyết hơn về mặt lý thuyết đo lường, cũng thuận tiện để không phân biệt giữa pmfs và pdf trong lập trình thống kê. Ví dụ, R có rất nhiều phân phối tích hợp. Đối với mỗi phân phối, nó có 4 chức năng. Ví dụ: đối với phân phối bình thường (từ tệp trợ giúp):

dnorm gives the density, pnorm gives the distribution function, qnorm gives the quantile function, and rnorm generates random deviates.

Người dùng R nhanh chóng sử dụng các d,p,q,rtiền tố. Sẽ thật khó chịu nếu bạn phải làm một cái gì đó như thả dvà sử dụng, mví dụ như phân phối nhị thức. Thay vào đó, mọi thứ như người dùng R mong đợi:

dbinom gives the density, pbinom gives the distribution function, qbinom gives the quantile function and rbinom generates random deviates.

3
scipy.statsphân biệt, một số đối tượng có một pdfphương thức và những đối tượng khác có một pmfphương thức. Nó thật sự làm phiền tôi!
Matthew Drury
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.