Tại sao chúng ta cần sigma-đại số để xác định không gian xác suất?


122

Chúng tôi có một thử nghiệm ngẫu nhiên với các kết quả khác nhau tạo thành không gian mẫu trên đó chúng tôi quan tâm đến các mẫu nhất định, được gọi là sự kiệnSigma-đại số (hoặc trường sigma) được tạo thành từ các sự kiện mà phép đo xác suất có thể được chỉ định. Một số thuộc tính được đáp ứng, bao gồm cả tập hợp null và toàn bộ không gian mẫu và một đại số mô tả các hiệp và giao với sơ đồ Venn.Ω, F. P

Xác suất được định nghĩa là một hàm giữa hàm và khoảng . Nhìn chung, bộ ba tạo thành một không gian xác suất .σ[0,1](Ω,F,P)

Ai đó có thể giải thích bằng tiếng Anh đơn giản tại sao tòa nhà xác suất sẽ sụp đổ nếu chúng ta không có -đau khớp? Họ chỉ được kết hợp ở giữa với chữ "F" thư pháp không tưởng. Tôi tin rằng họ là cần thiết; Tôi thấy rằng một sự kiện khác với kết quả, nhưng điều gì sẽ xảy ra nếu không có -achebras?σσ

Câu hỏi đặt ra là: Trong loại vấn đề xác suất nào, định nghĩa về không gian xác suất bao gồm cả -đau khớp trở thành một điều cần thiết?σ


Tài liệu trực tuyến này trên trang web của Đại học Dartmouth cung cấp một lời giải thích dễ hiểu bằng tiếng Anh. Ý tưởng là một con trỏ quay tròn ngược chiều kim đồng hồ trên một vòng tròn chu vi đơn vị :

nhập mô tả hình ảnh ở đây

Chúng tôi bắt đầu bằng cách xây dựng một spinner, bao gồm một vòng tròn có chu vi đơn vị và một con trỏ như trong hình [Hình]. Chúng tôi chọn một điểm trên vòng tròn và dán nhãn , rồi dán nhãn cho mọi điểm khác trên vòng tròn với khoảng cách, giả sử , từ đến điểm đó, được đo ngược chiều kim đồng hồ. Thí nghiệm bao gồm quay con trỏ và ghi nhãn của điểm ở đầu con trỏ. Chúng ta để biến ngẫu nhiên biểu thị giá trị của kết quả này. Không gian mẫu rõ ràng là khoảng0x0X[0,1)0 0 0 0 1. Chúng tôi muốn xây dựng một mô hình xác suất trong đó mỗi kết quả có khả năng xảy ra như nhau. Nếu chúng tôi tiến hành như chúng tôi đã làm [...] cho các thử nghiệm với số lượng kết quả có thể có, thì chúng tôi phải gán xác suất cho mỗi kết quả, vì nếu không, tổng xác suất, trên tất cả các kết quả có thể, sẽ không bằng 1. (Trên thực tế, tổng một số lượng thực không thể đếm được là một công việc khó khăn, đặc biệt, để một số tiền như vậy có ý nghĩa gì, nhiều nhất là rất nhiều số triệu hồi có thể khác ) Tuy nhiên, nếu tất cả các xác suất được chỉ định là , sau đó tổng là , không phải , như vậy.00001

Vì vậy, nếu chúng ta gán cho mỗi điểm bất kỳ xác suất nào và cho rằng có số điểm vô hạn (không thể đếm được), tổng của chúng sẽ cộng thêm >1 .


9
Có vẻ như tự chuốc lấy thất bại để xin câu trả lời về -fields mà không đề cập đến lý thuyết đo lường! σ
Tây An

5
Tôi đã làm, mặc dù ... tôi không chắc tôi hiểu nhận xét của bạn.
Antoni Parellada

8
Chắc chắn nhu cầu về các lĩnh vực sigma không chỉ là vấn đề quan điểm ... Tôi nghĩ rằng điều này có thể được xem xét về chủ đề ở đây (theo ý kiến ​​của tôi).
gung

8
Nếu nhu cầu của bạn cho lý thuyết xác suất bị hạn chế để "người đứng đầu" và "đuôi", sau đó rõ ràng không có nhu cầu cho -fields! σ
Tây An

26
Tôi nghĩ rằng đây là một câu hỏi hay. Vì vậy, thường bạn thấy trong sách giáo khoa tài liệu tham khảo hoàn toàn không cần đến gấp ba khả năng mà tác giả sau đó tiếp tục hoàn toàn bỏ qua sau đó. (Ω,ĐỤ,P)
DSaxton

Câu trả lời:


124

Đến thời điểm đầu tiên Tây An: Khi bạn đang nói về -algebras, bạn đang hỏi về bộ đo lường được, vì vậy không may bất kỳ câu trả lời phải tập trung vào lý thuyết đo lường. Mặc dù vậy, tôi sẽ cố gắng xây dựng lên một cách nhẹ nhàng.σ

Một lý thuyết về xác suất thừa nhận tất cả các tập hợp con của tập hợp không đếm được sẽ phá vỡ toán học

Hãy xem xét ví dụ này. Giả sử bạn có một hình vuông đơn vị trong và bạn quan tâm đến xác suất chọn ngẫu nhiên một điểm là thành viên của một bộ cụ thể trong hình vuông đơn vị. Trong nhiều trường hợp, điều này có thể được trả lời dễ dàng dựa trên so sánh các khu vực của các bộ khác nhau. Ví dụ: chúng ta có thể vẽ một số hình tròn, đo diện tích của chúng và sau đó lấy xác suất là phần nhỏ của hình vuông rơi trong hình tròn. Rất đơn giản.R2

Nhưng nếu khu vực của bộ lợi ích không được xác định rõ thì sao?

Nếu khu vực không được xác định rõ, thì chúng ta có thể đưa ra hai kết luận khác nhau nhưng hoàn toàn hợp lệ (theo một nghĩa nào đó) về khu vực đó là gì. Vì vậy, chúng ta có thể có trên một mặt và mặt khác P ( A ) = 0 , hàm ý 0 = 1 . Điều này phá vỡ tất cả các toán học ngoài sửa chữa. Bây giờ bạn có thể chứng minh 5 < 0 và một số điều phi lý khác. Rõ ràng điều này không quá hữu ích.P(Một)= =1P(Một)= =00= =15<0

σ -algebras là những miếng vá mà sửa toán học

A là gì -algebra, chính xác? Nó thực sự không đáng sợ. Đó chỉ là một định nghĩa về bộ nào có thể được coi là sự kiện. Các phần tử không có trong F đơn giản là không có thước đo xác suất xác định. Về cơ bản, σσĐỤσ -algebras là những "miếng vá" cho phép chúng ta tránh được một số hành vi bệnh lý của toán học, cụ thể là bộ phi thể đo lường được.

Ba yêu cầu của một -field có thể được coi là hậu quả của những gì chúng tôi muốn làm gì với xác suất: Một σ -field là một tập hợp có ba thuộc tính:σσ

  1. Đóng cửa dưới các công đoàn đếm được.
  2. Đóng cửa dưới giao lộ đếm được.
  3. Đóng cửa dưới bổ sung.

Các hiệp hội có thể đếm được và các thành phần nút giao có thể đếm được là hậu quả trực tiếp của vấn đề tập hợp không thể đo lường được. Đóng cửa dưới bổ sung là kết quả của các tiên đề Kolmogorov: nếu , P ( A c ) ought là 1 / 3 . Nhưng không có (3), có thể xảy ra rằng P ( A c ) không xác định. Điều đó sẽ là lạ. Đóng dưới phần bổ sung và các tiên đề Kolmogorov cho phép chúng ta nói những điều như P ( A A c ) = P (P(Một)= =2/3P(Mộtc)1/3P(Mộtc) .P(MộtMộtc)= =P(Một)+1-P(Một)= =1

Cuối cùng, chúng tôi đang xem xét các sự kiện liên quan đến , vì vậy chúng tôi tiếp tục yêu cầu Ω FΩΩĐỤ

Tin tốt: -algebras chỉ là thực sự cần thiết cho bộ đếmσ

Nhưng! Cũng có tin tốt ở đây. Hoặc, ít nhất, một cách để khắc phục vấn đề. Chúng tôi chỉ cần -achebras nếu chúng tôi làm việc trong một tập hợp với số lượng thẻ không thể đếm được. Nếu chúng ta hạn chế mình để tập hợp đếm được, thì chúng ta có thể tận F = 2 Ω bộ sức mạnh của Ω và chúng tôi sẽ không có bất kỳ những vấn đề này bởi vì đối với đếm được Ω , 2 ΩσĐỤ= =2ΩΩΩ2Ω bao gồm duy nhất của bộ đo lường được. (Điều này được ám chỉ trong nhận xét thứ hai của Xi'an.) Bạn sẽ nhận thấy rằng một số sách giáo khoa sẽ thực sự có một ánh sáng tinh tế ở đây và chỉ xem xét các bộ có thể đếm được khi thảo luận về không gian xác suất.

Ngoài ra, trong các vấn đề hình học trong , nó hoàn toàn đủ để chỉ xem xét σ -algebras gồm bộ mà L n biện pháp được xác định. Để căn cứ điều này chắc chắn hơn, L n cho n = 1 , 2 , 3 tương ứng với các khái niệm thông thường về chiều dài, diện tích và âm lượng. Vì vậy, điều tôi đang nói trong ví dụ trước là tập hợp cần phải có một khu vực được xác định rõ để nó có xác suất hình học được gán cho nó. Và lý do là: nếu chúng ta thừa nhận các tập hợp không thể đo lường được, thì chúng ta có thể kết thúc trong các tình huống có thể gán xác suất 1 cho một số sự kiện dựa trên một số bằng chứng và xác suất 0 choRviết sai rồiσLviết sai rồiLviết sai rồiviết sai rồi= =1,2,3sự kiện tương tự dựa trên một số bằng chứng khác.

Nhưng đừng để kết nối đến các bộ không đếm được làm bạn bối rối! Một quan niệm sai lầm phổ biến mà -algebras là tập hợp đếm được. Trong thực tế, chúng có thể đếm được hoặc không đếm được. Hãy xem xét minh họa này: như trước đây, chúng ta có một hình vuông đơn vị. Xác định F = Tất cả các tập con của hình vuông đơn vị với số  đo L 2 đã xác định  . Bạn có thể vẽ một hình vuông B với bên chiều dài s cho tất cả s ( 0 , 1 ) , và với một góc ở ( 0 , 0 )σ

ĐỤ= =Tất cả các tập con của hình vuông đơn vị được xác định L2 đo lường.
BSS(0,1)(0,0). Cần phải rõ ràng rằng hình vuông này là một tập hợp con của hình vuông đơn vị. Hơn nữa, tất cả các ô vuông đã xác định khu vực, do đó, những hình vuông là những yếu tố của . Nhưng cũng cần phải rõ ràng rằng có vô số hình vuông B : số lượng hình vuông như vậy là không thể đếm được, và mỗi hình vuông đã xác định số đo Lebesgue.ĐỤB

Vì vậy, như một vấn đề thực tế, chỉ cần thực hiện quan sát đó thường đủ để khiến cho việc quan sát mà bạn chỉ xem xét các bộ có thể đo lường được Lebesgue để đạt được mục tiêu chống lại vấn đề lợi ích.

Nhưng chờ đã, một bộ không thể đo lường là gì?

Tôi sợ rằng tôi chỉ có thể làm sáng tỏ một chút về điều này bản thân mình. Nhưng nghịch lý Banach-Tarski (đôi khi là nghịch lý "mặt trời và hạt đậu") có thể giúp chúng ta một số:

Cho một quả bóng rắn trong không gian 3 chiều, tồn tại sự phân hủy của quả bóng thành một số lượng nhỏ các tập hợp rời rạc, sau đó có thể được đặt lại với nhau theo một cách khác để tạo ra hai bản sao giống hệt của quả bóng ban đầu. Thật vậy, quá trình lắp ráp lại chỉ liên quan đến việc di chuyển các mảnh xung quanh và xoay chúng, mà không thay đổi hình dạng của chúng. Tuy nhiên, bản thân các mảnh không phải là "chất rắn" theo nghĩa thông thường, mà là sự phân tán vô hạn của các điểm. Việc xây dựng lại có thể làm việc với ít nhất năm mảnh.

Một dạng mạnh hơn của định lý ngụ ý rằng đưa ra bất kỳ hai vật thể rắn "hợp lý" nào (chẳng hạn như một quả bóng nhỏ và một quả bóng khổng lồ), một trong hai có thể được ghép lại thành vật kia. Điều này thường được tuyên bố một cách không chính thức là "một hạt đậu có thể được cắt nhỏ và lắp lại vào Mặt trời" và được gọi là "nghịch lý hạt đậu và Mặt trời". 1

Vì vậy, nếu bạn đang làm việc với xác suất trong và bạn đang sử dụng thước đo xác suất hình học (tỷ lệ khối lượng), bạn muốn tìm ra xác suất của một số sự kiện. Nhưng bạn sẽ đấu tranh để xác định chính xác xác suất đó, bởi vì bạn có thể sắp xếp lại các bộ không gian của mình để thay đổi âm lượng! Nếu xác suất phụ thuộc vào khối lượng và bạn có thể thay đổi âm lượng của tập hợp thành kích thước của mặt trời hoặc kích thước của hạt đậu, thì xác suất cũng sẽ thay đổi. Vì vậy, không có sự kiện sẽ có một xác suất duy nhất được gán cho nó. Thậm chí tệ hơn, bạn có thể sắp xếp lại S Ω như vậy mà khối lượng của SV ( S ) > V ( Ω )R3SΩSV(S)>V(Ω), ngụ ý rằng phép đo xác suất hình học báo cáo xác suất , vi phạm trắng trợn các tiên đề Kolmogorov đòi hỏi xác suất đó có biện pháp 1.P(S)>1

Để giải quyết nghịch lý này, người ta có thể đưa ra một trong bốn nhượng bộ:

  1. Âm lượng của một bộ có thể thay đổi khi nó được xoay.
  2. Âm lượng hợp nhất của hai tập hợp rời rạc có thể khác với tổng khối lượng của chúng.
  3. Các tiên đề của Zermelo giáo Fraenkel đặt lý thuyết với tiên đề của Sự lựa chọn (ZFC) có thể phải được thay đổi.
  4. Một số bộ có thể được gắn thẻ "không đo được" và người ta sẽ cần kiểm tra xem một bộ có "đo được" hay không trước khi nói về âm lượng của nó.

Tùy chọn (1) không giúp sử dụng xác định xác suất, vì vậy nó ra. Tùy chọn (2) vi phạm tiên đề Kolmogorov thứ hai, vì vậy nó ra. Tùy chọn (3) có vẻ như là một ý tưởng tồi tệ vì ZFC khắc phục rất nhiều vấn đề hơn so với nó tạo ra. Nhưng tùy chọn (4) có vẻ hấp dẫn: nếu chúng ta phát triển một lý thuyết về những gì là và không thể đo lường được, thì chúng ta sẽ có xác suất được xác định rõ trong vấn đề này! Điều này đưa chúng ta trở lại để đo lý thuyết, và một người bạn của chúng tôi -algebra.σ


5
Cảm ơn bạn vì câu trả lời. là viết tắt của Lebesque có thể đo lường được? Tôi sẽ +1 câu trả lời của bạn về đức tin, nhưng tôi thực sự đánh giá cao nó nếu bạn có thể hạ thấp cấp độ toán học ... :-)L
Antoni Parellada

7
(+1) Điểm tốt! Tôi cũng sẽ nói thêm rằng không có biện pháp và đại số, điều hòa và tạo ra các phân phối có điều kiện trên các không gian không thể đếm được sẽ có nhiều lông, như thể hiện trong nghịch lý Borel-Kolmogorov . σ
Tây An

2
@ Xi'an Cảm ơn những lời tốt đẹp! Nó thực sự có ý nghĩa rất nhiều, đến từ bạn. Tôi không quen thuộc với nghịch lý Borel-Kolmogorov khi viết bài này, nhưng tôi sẽ đọc và xem liệu tôi có thể xoay sở để bổ sung những phát hiện hữu ích của mình không.
Sycorax

3
@ Student001: Tôi nghĩ rằng chúng tôi đang chia tóc ở đây. Bạn đúng rằng định nghĩa chung về "biện pháp" (bất kỳ biện pháp nào) được đưa ra bằng cách sử dụng khái niệm sigma-đại số. Tuy nhiên, quan điểm của tôi là không có từ hoặc khái niệm "sigma-đại số" trong định nghĩa của biện pháp Lebesgue được cung cấp trong liên kết đầu tiên của tôi. Nói cách khác, người ta có thể định nghĩa thước đo Lebesgue theo liên kết đầu tiên của tôi nhưng sau đó người ta cần chứng minh rằng đó là thước đo và đó là phần khó. Tôi đồng ý rằng chúng ta nên dừng cuộc thảo luận này mặc dù.
amip

3
Tôi thực sự rất thích đọc câu trả lời của bạn. Tôi không biết làm thế nào để cảm ơn bạn, nhưng bạn đã làm rõ mọi thứ rất nhiều! Tôi chưa bao giờ nghiên cứu phân tích thực tế cũng như không có một giới thiệu thích hợp về toán học. Đã đến từ một nền tảng Kỹ thuật điện tập trung rất nhiều vào việc thực hiện thực tế. Bạn đã viết rằng bằng những thuật ngữ đơn giản đến mức một người như tôi có thể hiểu nó. Tôi thực sự đánh giá cao câu trả lời của bạn và sự đơn giản mà bạn đã cung cấp. Cũng cảm ơn @ Xi'an cho ý kiến ​​đóng gói của mình!
Zushauque

19

[0,18),[18,25),[25,34),Giáo dục(Ω,ĐỤ)ĐỤ[18,25)[20,30)[20,30)ĐỤ

(Ω',ĐỤ')đụ:đụ-1(1)ĐỤđụ

ĐỤĐỤMộtBMộtBMộtB. Bây giờ, yêu cầu đóng cửa cho các giao lộ và hiệp hội có thể đếm được cho phép chúng tôi hỏi các liên kết hoặc bất đồng đếm được. Và, phủ nhận một câu hỏi được đại diện bởi bộ bổ sung. Điều đó cho chúng ta một đại số sigma.

Tôi đã thấy loại giới thiệu này đầu tiên trong cuốn sách rất hay của Peter Whittle "Xác suất thông qua kỳ vọng" (Springer).

BIÊN TẬP

TôiTôiσσviết sai rồiσviết sai rồiσ

Nhưng chúng ta có thực sự cần luật mạnh của số lượng lớn? Theo một câu trả lời ở đây , có thể không.

viết sai rồiviết sai rồi

σ


4
σP(A)[20,30)P(Một)[20,30)P(Một)[18,34)được xác định rõ ràng, vì vậy thậm chí không rõ ràng rằng ví dụ này minh họa những gì bạn muốn nó.
Sycorax

5
σσ

2
σ

3
Tôi nghĩ rằng lập luận của bạn là âm thanh. Tuy nhiên, cuối cùng tôi đã có một chút ngạc nhiên khi tôi gặp phải sự khẳng định này: "yêu cầu sự đóng kín đối với các giao lộ và công đoàn có thể đếm được cho phép chúng tôi hỏi các liên kết hoặc bất đồng có thể đếm được." Điều này dường như có được cốt lõi của vấn đề: tại sao bất cứ ai cũng muốn xây dựng một sự kiện vô cùng phức tạp như vậy? Một câu trả lời tốt cho điều đó sẽ làm cho phần còn lại của bài viết của bạn thuyết phục hơn.
whuber

2
Sử dụng lại thực tế: lý thuyết xác suất và đo lường được sử dụng trong toán học tài chính (bao gồm phương trình vi phân ngẫu nhiên, tích phân Ito, lọc đại số, v.v.) có vẻ như không thể nếu không có đại số sigma. (Tôi không thể đưa ra các chỉnh sửa vì tôi đã bỏ phiếu cho câu trả lời của bạn!)
whuber

2

σ

σAB(AB)C

Tiên đề đầu tiên là,. Vâng, bạn LUÔN LUÔN biết xác suất không có gì xảy ra (0) hoặc điều gì đó xảy ra (1).

Tiên đề thứ hai được đóng lại dưới phần bổ sung. Hãy để tôi đưa ra một ví dụ ngu ngốc. Một lần nữa, hãy xem xét một lần lật đồng xu, với = {, 𝑇}. Giả sử tôi nói với bạn rằng đại số cho lần lật này là {∅, 𝑋, {𝐻}}. Đó là, tôi biết xác suất xảy ra KHÔNG xảy ra, về SOMETHING xảy ra và của những người đứng đầu nhưng tôi không biết xác suất của một cái đuôi. Bạn sẽ gọi tôi là một kẻ ngốc. Bởi vì nếu bạn biết xác suất của một cái đầu, bạn sẽ tự động biết xác suất của một cái đuôi! Nếu bạn biết xác suất của một cái gì đó xảy ra, bạn biết xác suất của nó KHÔNG xảy ra (phần bù)!

Tiên đề cuối cùng được đóng lại dưới các hiệp hội đếm được. Hãy để tôi cho bạn một ví dụ ngu ngốc khác. Hãy xem xét cuộn của một con súc sắc, hoặc = {1,2,3,4,5,6}. Điều gì sẽ xảy ra nếu tôi nói với bạn đại số cho điều này là {∅, 𝑋, {1}, {2}}. Đó là, tôi biết xác suất cán 1 hoặc lăn 2, nhưng tôi không biết xác suất lăn 1 hoặc 2. Một lần nữa, bạn sẽ gọi tôi là thằng ngốc một cách chính đáng (tôi hy vọng lý do đã rõ). Điều gì xảy ra khi các bộ không rời rạc, và những gì xảy ra với các hiệp hội không thể đếm được thì hơi rắc rối hơn nhưng tôi hy vọng bạn có thể thử nghĩ về một số ví dụ.

σ

Vâng, nó không phải là một trường hợp hoàn toàn sạch, nhưng có một số lý do vững chắc tại sao .

Tại sao các nhà xác suất cần các biện pháp?

σσP

Mọi người mang đến bộ Vitali và Banach-Tarski để giải thích lý do tại sao bạn cần lý thuyết đo lường, nhưng tôi nghĩ đó là sai lầm . Thiết lập của Vitali chỉ dành cho các biện pháp (không tầm thường) là bất biến dịch thuật, điều mà không gian xác suất không yêu cầu. Và Banach-Tarski đòi hỏi phải xoay vòng. Những người phân tích quan tâm đến họ, nhưng các nhà xác suất thực sự thì không .

Các raison d'être của lý thuyết đo lường trong lý thuyết xác suất là để thống nhất việc xử lý RVs rời rạc và liên tục, và hơn nữa, cho phép RVs đó được trộn lẫn và RVs mà chỉ đơn giản là không phải.


σσ
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.