Bất cứ ai cũng có thể làm rõ khái niệm về một tổng số biến ngẫu nhiên


21

Trong lớp xác suất của tôi, thuật ngữ "tổng các biến ngẫu nhiên" liên tục được sử dụng. Tuy nhiên, tôi bị mắc kẹt về chính xác điều đó có nghĩa là gì?

Có phải chúng ta đang nói về tổng của một loạt các nhận thức từ một biến ngẫu nhiên? Nếu vậy, không phải là thêm một số? Làm thế nào một tổng số thực hiện biến ngẫu nhiên dẫn chúng ta đến một phân phối, hoặc một cdf / pdf / chức năng của bất kỳ loại nào? Và nếu đó không phải là nhận thức biến ngẫu nhiên, vậy chính xác thì cái gì đang được thêm vào?


1
Bằng 'nhận ra một biến ngẫu nhiên' Tôi giả sử bạn có nghĩa là các giá trị quan sát thực tế. Những gì đang được tổng hợp trong 'tổng các biến ngẫu nhiên' là các biến ngẫu nhiên trước khi chúng được quan sát. Hãy tưởng tượng tính toán trọng lượng của 5 người tiếp theo để lên thang máy. Bạn không biết trọng số của chúng (chưa) và do đó chúng là một biến ngẫu nhiên. Nhưng bạn có thể muốn biết một cái gì đó về việc phân phối tổng trọng lượng của chúng.
PeterR

@PeterR Đây là những gì tôi không hiểu. Làm thế nào có ý nghĩa để nói về việc thêm một cái gì đó chưa có giá trị? Nó có phải là một kiểu ẩn dụ của tổng kết?
Gosset

1
Tôi nghĩ vấn đề của bạn là bạn không hiểu thế nào là một biến ngẫu nhiên. Nếu bạn có được khái niệm này thì số tiền cũng sẽ đến một cách dễ dàng.
Aksakal

@Aksakal Không phải thực tế là tôi đã đăng câu hỏi này bằng chứng về điều đó rồi sao? Có lẽ nếu bạn biết điều đó, bạn có thể làm rõ khái niệm này?
Gosset

Câu trả lời tuyệt vời đã được đưa ra. Một ví dụ điển hình là tổng của hai con xúc xắc, . Kết quả rõ ràng là ngẫu nhiên (bạn không biết trước tổng của cả hai cái chết sẽ là bao nhiêu). Chúng ta biết rằng X , Y U n i f ( 1 , 6 ) và độc lập. Hóa ra X + Y có phân bố tam giác. X+YX,YUnif(1,6)X+Y
bdeonovic

Câu trả lời:


39

Một mô hình vật lý, trực quan của một biến ngẫu nhiên là viết tên của mọi thành viên trong dân số lên một hoặc nhiều tờ giấy - "vé" - và đặt những vé đó vào một hộp. Quá trình trộn kỹ các nội dung của hộp, sau đó là mù quáng rút ra một vé - chính xác như trong xổ số - mô hình ngẫu nhiên. Xác suất không đồng nhất được mô hình hóa bằng cách giới thiệu số lượng vé khác nhau trong hộp: nhiều vé hơn cho các thành viên có xác suất cao hơn, ít hơn cho các xác suất ít hơn.

Một biến ngẫu nhiên là một số liên kết với mỗi thành viên của dân số. (Do đó, để thống nhất, mỗi vé cho một thành viên nhất định phải có cùng một số được ghi trên đó.) Nhiều biến ngẫu nhiên được mô hình hóa bằng cách đặt chỗ trên các vé cho nhiều hơn một số. Chúng tôi thường đưa ra những cái tên không gian như Y ,Z . Các tổng của các biến ngẫu nhiên là tổng thông thường: dành một không gian mới trên mỗi vé cho Tóm lại, đọc ra các giá trị của X , Y , vv trên mỗi vé và viết tổng hợp của họ trong không gian mới. Đây là một cách nhất quán để viết số trên vé, vì vậy đây là một biến ngẫu nhiên khác.X, Y,ZX, Y,

Nhân vật

Con số này miêu tả một hộp đại diện cho một dân và ba biến ngẫu nhiên X , Y , và X + Y . Nó chứa sáu vé: ba cho α (màu xanh) cho nó một xác suất 3 / 6 , hai cho β (màu vàng) cho nó một khả năng 2 / 6 , và một cho γ (màu xanh) cho nó một khả năng 1 / 6Ω={α,β,γ}XYX+Yα3/6β2/6γ1/6. Để hiển thị những gì được viết trên vé, chúng được hiển thị trước khi được trộn lẫn.

Cái hay của cách tiếp cận này là tất cả các phần nghịch lý của câu hỏi hóa ra lại đúng:

  • tổng các biến ngẫu nhiên thực sự là một số duy nhất, xác định (cho mỗi thành viên trong dân số),

  • tuy nhiên, nó cũng dẫn đến một phân phối (được đưa ra bởi các tần số mà tổng xuất hiện trong hộp) và

  • nó vẫn mô hình hiệu quả một quá trình ngẫu nhiên (vì vé vẫn được rút ra một cách mù quáng từ hộp).

Theo cách này, tổng có thể đồng thời có một giá trị xác định (được đưa ra bởi các quy tắc cộng như áp dụng cho các số trên mỗi vé) trong khi nhận ra - trong đó sẽ là một vé được rút ra từ hộp - không có giá trị cho đến khi nó được thực hiện

Mô hình vật lý này của việc rút vé từ một hộp được áp dụng trong tài liệu lý thuyết và được thực hiện nghiêm ngặt với các định nghĩa về không gian mẫu (dân số), đại số sigma (với các số đo xác suất liên quan của chúng) và các biến ngẫu nhiên là các hàm đo được xác định trên không gian mẫu .

Tài khoản các biến ngẫu nhiên này được xây dựng, với các ví dụ thực tế, tại "Biến ngẫu nhiên có nghĩa là gì?" .


3
+1 bài viết mẫu mực. Tôi hy vọng bạn không bận tâm đến câu hỏi xấc láo, nhưng minh họa được thực hiện trong gì?
Glen_b -Reinstate Monica

4
@Glen_b PowerPoint :-). Hình ảnh của một hộp là từ mymiddlec.files.wordpress.com/2013/09/empty-box.jpg . Các vé là đồ họa PowerPoint. (Không có gì xấc xược về những câu hỏi như vậy!) Tôi đã nhóm toàn bộ bó, dán nó vào Paint và sử dụng nó để lưu nó dưới dạng tệp .png.
whuber

Tôi đang thiếu một cái gì đó nhưng có vẻ như bạn chỉ đang viết nhiều nhãn số cho mỗi thành viên trong dân số. Tất cả các chữ cái đều có X = 1, Y = 2 và do đó X + Y = 3 .. X, Y và X + Y có cùng phân phối, được dịch chuyển bởi một giá trị ở đây một giá trị ở đó, vì các lebels khác nhau
MiloMinderbinder

1
@whuber - nên có tần số bằng văn bản. Không thành thạo các thuật ngữ toán học để nói 'thước đo xác suất cơ bản'. dù sao bạn đang nhận được sự trôi dạt của tôi. Tôi bắt đầu thấy làm thế nào tôi có thể chơi xung quanh với các con số trên vé để cung cấp cho nó phân phối xác suất mong muốn. Ở cấp độ chữ thảo, cách tiếp cận này có vẻ giống như một trò chơi chữ với các 'nhãn' khác nhau và do đó không thấy rõ ràng. đây sẽ giống như lần thứ 50 bạn giúp tôi trên trang này. cảm ơn bạn
MiloMinderbinder

1
@Milo Bạn được chào đón. Bây giờ tôi thấy rằng bạn đã phản ứng với ví dụ trong câu trả lời này thay vì ví dụ tôi đã đưa ra trong các nhận xét trước đó. Ví dụ của câu trả lời thực sự có ba vé khác nhau với tần suất tương đối 1: 2: 3, và đó là tất cả những gì "thước đo xác suất" có nghĩa trong trường hợp này. Tuy nhiên, đây không chỉ là biệt ngữ: có nhu cầu sâu sắc đối với các khái niệm cơ bản. Xem, liên alia, stats.stackexchange.com/questions/199280 cho một số tài khoản đẹp.
whuber

4

không có bí mật nào đằng sau cụm từ này, nó đơn giản như bạn có thể nghĩ: nếu X và Y là hai biến ngẫu nhiên, tổng của chúng là X + Y và tổng này cũng là một biến ngẫu nhiên. Nếu X_1, X_2, X_3, ..., X_n và là n biến ngẫu nhiên, tổng của chúng là X_1 + X_2 + X_3 + ... + X_n và tổng này cũng là một biến ngẫu nhiên (và nhận ra tổng này là một biến số, cụ thể là tổng của n hiện thực).

Tại sao bạn nói quá nhiều về tổng các biến ngẫu nhiên trong lớp? Một lý do là định lý giới hạn trung tâm (đáng kinh ngạc): nếu chúng ta tổng hợp nhiều biến ngẫu nhiên độc lập, chúng ta có thể "dự đoán" phân phối của tổng này (gần như) độc lập với phân phối của các biến đơn trong tổng! Tổng có xu hướng trở thành phân phối bình thường và đây là lý do có thể khiến chúng ta quan sát phân phối bình thường rất thường xuyên trong thế giới thực.


3

rv là mối quan hệ giữa sự xuất hiện của một sự kiện và một số thực. Giả sử, nếu trời mưa giá trị X là 1, nếu không thì 0. Bạn có thể có một rv Y khác bằng 10 khi trời lạnh và 100 khi trời nóng. Vì vậy, nếu trời mưa và lạnh thì X = 1, Y = 10 và X + Y = 11.

Giá trị X + Y là 10 (không mưa lạnh); 11 (mưa, lạnh), 100 (không mưa, nóng) và 110 (mưa, nóng). Nếu bạn tính xác suất của các sự kiện, thì bạn sẽ nhận được PMF của rv X + Y mới này.


1

X,YX+YΩ1×Ω2X,YΩ={Head,Tail}X(Head)=Y(Head)=1,X(Tail)=Y(Tail)=0(X+Y)X,YσX,Y

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.