Tại sao tổng xác suất trong phân phối thống nhất liên tục không phải là vô cùng?


9

Hàm mật độ xác suất

Hàm mật độ xác suất của phân phối đồng đều (liên tục) được hiển thị ở trên. Vùng bên dưới đường cong là 1 - điều này có ý nghĩa vì tổng tất cả các xác suất trong phân phối xác suất là 1.

Chính thức, hàm xác suất trên (f (x)) có thể được định nghĩa là

1 / (ba) cho x trong [a, b]

và 0 nếu không

Hãy xem xét rằng tôi phải chọn một số thực giữa a (nói, 2) và b (nói, 6). Điều này làm cho xác suất đồng nhất = 0,25. Tuy nhiên, vì có một số lượng vô hạn trong khoảng đó, nên tổng của tất cả các xác suất có phải là vô hạn không? Tôi đang nhìn cái gì?

Là f (x) không phải là xác suất của số x xảy ra?



1
xf(x) không phải là một xác suất hàm nó là một mật độ xác suất chức năng . Nghĩa là, nó không cung cấp cho bạn xác suất là một số nhất định, nhưng mật độ xác suất hoặc xác suất trên mỗi đơn vị độ dài dọc theo trục x. Bạn sử dụng tích hợp để có được tổng xác suất cho loại hàm này không phải là tổng. x
HelloGoodbye

Câu trả lời:


18

a a + .1 a bf(x) mô tả mật độ xác suất thay vì khối lượng xác suất trong ví dụ của bạn. Nói chung, đối với các phân phối liên tục, các sự kiện mà các điều chúng ta có được xác suất cho các phạm vicác phạm vi giá trị, chẳng hạn như đối với khu vực dưới đường cong từ đến hoặc từ đến (mặc dù các phạm vi đó không cần phải liền kề nhau) . Đối với phân phối liên tục, xác suất của bất kỳ giá trị đơn lẻ nào xảy ra thường là 0.aa+.1ab


Có cách nào chính xác hơn về mặt kỹ thuật để nói những gì bạn đang cố nói không? Tôi lo lắng điều "phạm vi" sẽ khiến mọi người bỏ cuộc, vì việc phân phối liên tục có thể có Dirac deltas ...
user541686

3
@Mehrdad: Đồng bằng dirac không có phân phối liên tục. Cách gán xác suất phù hợp sẽ thông qua . P(A)=A1dF
Alex R.

1
@AlexR.: Oof, tôi giả sử "phân phối liên tục" bạn chỉ có nghĩa là phân phối trên một miền liên tục, vì đó là những gì mọi người đề cập đến khi họ nói đồng bằng Dirac là tương tự liên tục của đồng bằng Kronecker. Cảm ơn đã làm rõ.
dùng541686

@Mehrdad Tôi đã nghĩ chính xác về đồng bằng của Dirac, nhưng tôi hy vọng bạn sẽ nhận thấy thuật ngữ "nói chung", và cũng là mức độ hiểu biết thống kê rõ ràng của OP.
Alexis

@Mehrdad Công thức kỹ thuật của một biến ngẫu nhiên là về mặt đo lường: có một hàm từ tập hợp sức mạnh của không gian sự kiện đến khoảng [0,1]. Hàm mật độ xác suất có thể được sử dụng làm thước đo (số đo của một tập hợp đơn giản là tích phân của PDF so với tập hợp đó), nhưng có các biện pháp, chẳng hạn như delta Dirac (một tập hợp có số đo 1 nếu chứa và bằng không nếu không), nói đúng ra, không hoạt động theo nghĩa truyền thống. x0
Tích lũy

11

Bởi vì mỗi thuật ngữ trong tổng kết được tính trọng số bởi d vô hạn . Tầm quan trọng của điều này có lẽ dễ hiểu nhất bằng cách cẩn thận bước qua một ví dụ rất cơ bản.x

Xem xét sử dụng phép tính tổng Riemann để tính diện tích theo vùng hình chữ nhật sau (một hình chữ nhật được chọn để loại bỏ khía cạnh gần đúng của phép tính tổng Riemann, không phải là trọng tâm ở đây): khu vực hình chữ nhật] Chúng ta có thể tính diện tích bằng 2 tiểu vùng hoặc bằng cách sử dụng 4 tiểu vùng . Trong trường hợp có 2 tiểu vùng (ký hiệu là ), các khu vực được cho bởi trong khi đó trong 4 tiểu vùng (ký hiệu là ), các khu vực được đưa ra bởi Tổng diện tích trong cả hai trường hợp tương ứng với Bây giờ, điều này khá rõ ràng, nhưng nó tăng câu hỏi quan trọng tinh tế đó là: tại sao hai câu trả lời này đồng ýAi

A1=A2=5×2=10
Bi
B1=B2=B3=B4=5×1=5
i=12Ai=i=14Bi=20
? Theo trực giác, rõ ràng là nó hoạt động vì chúng tôi đã giảm chiều rộng của các tiểu vùng thứ hai. Chúng tôi có thể xem xét thực hiện điều tương tự với 8 tiểu vùng, mỗi tiểu vùng có chiều rộng và một lần nữa với 16 ... và chúng tôi có thể tiếp tục quá trình này cho đến khi chúng tôi có vô số tiểu vùng, mỗi tiểu vùng có chiều rộng nhỏ là d . Miễn là mọi thứ luôn được cân chính xác, các câu trả lời phải luôn đồng ý. Nếu không có trọng số chính xác, tổng kết thực sự sẽ chỉ đơn giản là .0.5x

Đây là lý do tại sao tôi luôn đảm bảo chỉ ra cho học sinh rằng một tích phân không chỉ đơn giản là ký hiệu , mà là cặp ký hiệu .dx


5

Bạn đang hiểu sai phân phối xác suất theo cách sai - đó là vô số xác suất được chia vô hạn, vì vậy bạn không thể nói rằng "xác suất rút ra giá trị 0,5 từ phân phối đồng đều (0, 1)" bởi vì xác suất đó là không - có vô số giá trị có thể bạn có thể nhận được và tất cả chúng đều có khả năng như nhau, vì vậy rõ ràng xác suất của bất kỳ kết quả riêng lẻ nào là [1] .1=0

Thay vào đó, bạn có thể xem xét xác suất cho một loạt các kết quả và đo lường rằng sử dụng các khu vực (và do đó tích hợp). Ví dụ: nếu bạn rút ra từ phân phối đồng đều (0, 1) (với pdf cho và nếu không), thì xác suất kết quả của bạn nằm trong khoảng từ đến làf(x)=1x[0,1]f(x)=00.20.3

0.20.3f(x) dx=0.20.31 dx=[x]0.20.3=0.30.2=0.1

tức là bạn có 10% cơ hội nhận được kết quả trong phạm vi đó.

[1] Xin lỗi vì tất cả những người bị đau tim vì sự đơn giản hóa quá mức của tôi.


0

Nói chung, lý luận của bạn thất bại trong giả định này:

Tuy nhiên, vì có một số lượng vô hạn trong khoảng đó, nên tổng của tất cả các xác suất có phải là vô hạn không?

Đó là một vấn đề toán học, được biết đến từ Zeno of Elea Paradoxes .

Hai tuyên bố của ông là

  1. Một mũi tên không bao giờ có thể đạt được mục tiêu của nó
  2. Achilles sẽ không bao giờ vượt qua một con rùa

Cả hai đều dựa trên tuyên bố rằng bạn có thể xây dựng một chuỗi số dương vô hạn (trong trường hợp trước bằng cách nói rằng một mũi tên phải bay vô tận một nửa quãng đường còn lại đến mục tiêu, sau đó bằng cách nói rằng Achilles đã để đạt đến vị trí mà rùa đã ở trước đó và trong khi đó, rùa di chuyển đến một vị trí mới trở thành điểm gốc tham chiếu tiếp theo của chúng tôi).

Nhanh chóng chuyển tiếp, điều này dẫn đến một khám phá về số tiền vô hạn.

Vì vậy, trong tổng số vô hạn, nhiều số dương không nhất thiết phải là vô hạn ; tuy nhiên, nó có thể không phải là vô hạn chỉ khi (một sự đơn giản hóa quá mức, xin lỗi về điều đó) gần như tất cả các số trong chuỗi rất gần với 0, bất kể bạn yêu cầu chúng gần đến mức nào.

Vô cực chơi nhiều thủ đoạn hơn. Thứ tự bạn thêm các yếu tố của chuỗi cũng rất quan trọng và có thể dẫn đến một tình huống sắp xếp lại cho kết quả khác nhau!

Khám phá thêm một chút về nghịch lý vô cực . Bạn có thể ngạc nhiên.


Tôi không thấy cách diễn giải câu hỏi sao cho OP nghĩ về số tiền có thể đếm được.
JiK

0

f(x) mô tả mật độ xác suất và có đơn vị . Do đó với một x đã cho, bạn nhận được trong các đơn vị , chứ không phải p, như bạn đang tìm kiếm. Nếu bạn muốn p, bạn cần hàm phân phối cho một phạm vi nhất định, đó là xác suất p của x nằm trong a và b. f(x)=1px pf(x)=1bapx

Hy vọng điều này có ý nghĩa.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.