Chính xác thì phân phối là gì?


16

Tôi biết rất ít về Xác suất và Thống kê, và tôi muốn học. Tôi thấy từ "phân phối" được sử dụng ở mọi nơi trong các bối cảnh khác nhau.

Ví dụ: một biến ngẫu nhiên rời rạc có "phân phối xác suất". Tôi biết đây là gì. Một biến ngẫu nhiên liên tục có hàm mật độ xác suất, sau đó cho xR , tích phân từ đến x của hàm mật độ xác suất là hàm phân phối tích lũy được đánh giá tại x .

Và rõ ràng chỉ là "hàm phân phối" đồng nghĩa với "hàm phân phối tích lũy", ít nhất là khi nói về các biến ngẫu nhiên liên tục (câu hỏi: chúng có luôn là từ đồng nghĩa không?).

Sau đó có nhiều bản phân phối nổi tiếng. Γ phân phối χ2 phân phối, vv Tuy nhiên, những gì chính xác là một Γ phân phối? Đó có phải là hàm phân phối tích lũy của một Γ biến ngẫu nhiên? Hoặc xác suất hàm mật độ của một Γ biến ngẫu nhiên?

Nhưng sau đó, một phân phối tần số của một tập dữ liệu hữu hạn dường như là một biểu đồ.

Câu chuyện dài: trong Xác suất và Thống kê, định nghĩa của từ "phân phối" là gì?

Tôi biết định nghĩa phân phối trong Toán học (một yếu tố của không gian kép của tập hợp các hàm kiểm tra được trang bị cấu trúc liên kết giới hạn quy nạp), nhưng không phải là Xác suất và Thống kê.


1
Các bài viết Wikipedia tương ứng dường như là một giới thiệu tốt về chủ đề này.
Alexanderr Blekh

1
Nghiêm túc, 'phân phối' và 'cdf' nên được coi là từ đồng nghĩa, nhưng 'phân phối' thường được sử dụng theo nghĩa lỏng lẻo hơn và thường được sử dụng để thực sự đề cập đến mật độ / pmf.
Glen_b -Reinstate Monica

3
Sự hiểu biết của bạn về một phân phối khá gần với xác suất; sự khác biệt chính là những người có xác suất được hưởng một số tính chất bổ sung (có tính tích cực và được chuẩn hóa thành sự thống nhất). Kết nối là định nghĩa của bạn thiết lập phân phối theo thuật ngữ của toán tử kỳ vọng liên quan. Ngoài ra còn có sự lạm dụng (nghiêm trọng) ngôn ngữ phổ biến trong thống kê, điều này cũng gọi một họ phân phối được tham số hóa là "phân phối". Cuối cùng, bất kỳ tập dữ liệu hữu hạn nào cũng xác định phân phối thu được bằng cách lấy mẫu từ nó, "phân phối theo kinh nghiệm" của nó.
whuber

@whuber Điều đó giúp, cảm ơn Đặc biệt, việc lạm dụng ngôn ngữ. Nó giống như gọi tích phân không xác định của hàm ... một hàm.
danzibr

Một câu hỏi tương tự với câu trả lời hay: stats.stackexchange.com/questions/210403/ trên
kjetil b halvorsen

Câu trả lời:


7

Sau đây là cho biến ngẫu nhiên có giá trị. Việc mở rộng sang các không gian khác là thẳng về phía trước nếu bạn quan tâm. Tôi sẽ lập luận rằng định nghĩa chung chung hơn một chút là trực quan hơn so với việc xem xét riêng biệt các hàm phân phối mật độ, khối lượng và tích lũy.R

Tôi bao gồm một số thuật ngữ toán học / xác suất trong văn bản để làm cho nó chính xác. Nếu một người không quen thuộc với các thuật ngữ đó, thì trực giác cũng được nắm bắt tốt bằng cách chỉ nghĩ về "bộ Borel" là "bất kỳ tập hợp con nào tôi có thể nghĩ ra" và về biến ngẫu nhiên là kết quả số của một thí nghiệm với một thí nghiệm với xác suất liên quan.R


Hãy là một không gian xác suất và X ( ω ) là một R - có giá trị biến ngẫu nhiên trên không gian này.(Ω,F,P)X(ω)R

Chức năng thiết lập , nơi Một là một tập Borel, được gọi là sự phân bố của X .Q(A):=P(ωΩ:X(ω)A)AX

Nói cách khác, phân phối cho bạn biết (nói một cách lỏng lẻo), đối với bất kỳ tập hợp con nào của , xác suất mà X đảm nhận một giá trị trong tập đó. Người ta có thể chứng minh rằng Q hoàn toàn được xác định bởi hàm F ( x ) : = P ( X x ) và ngược lại. Để làm điều đó - và tôi bỏ qua các chi tiết ở đây - xây dựng một biện pháp trên bộ Borel rằng gán xác suất F ( x ) cho tất cả các bộ ( - , x ) và cho rằng biện pháp hữu hạn này đồng ý với Q trênRXQF(x):=P(Xx)F(x)(,x)Q hệ thống tạo Borel σ - đại số.πσ

Nếu nó xảy ra như vậy mà có thể được viết như Q ( A ) = Một f ( x ) d x thì f là một hàm mật độ cho Q và bạn có thể thấy, mặc dù mật độ này không được xác định duy nhất (xem xét thay đổi nào trên bộ Lebesgue đo zero), nó làm cho tinh thần để còn nói về e như sự phân bố của X . Thông thường, tuy nhiên, chúng tôi gọi nó là hàm mật độ xác suất của X .Q(A)Q(A)=Af(x)dxfQfXX

Tương tự như vậy, nếu nó xảy ra như vậy mà có thể được viết như Q ( A ) = Σ i A { ... , - 1 , 0 , 1 , ... } f ( i ) , sau đó nó làm cho tinh thần để nói chuyện của f là phân phối của X mặc dù chúng ta thường gọi nó là hàm khối lượng xác suất.Q(A)Q(A)=iA{,1,0,1,}f(i)fX

Do đó, bất cứ khi nào bạn đọc một cái gì đó như " tuân theo phân phối đồng đều trên [ 0 , 1 ] ", điều đó chỉ có nghĩa là hàm Q ( A ) , cho bạn biết xác suất X nhận các giá trị trong các tập hợp nhất định, được đặc trưng bởi Hàm mật độ xác suất f ( x ) = I [ 0 , 1 ] hoặc hàm phân phối tích lũy F ( x ) = x - f ( t )X[0,1]Q(A)Xf(x)=I[0,1] .F(x)=xf(t)dt

Một lưu ý cuối cùng về trường hợp không có đề cập đến một biến ngẫu nhiên, mà chỉ có một phân phối. Người ta có thể chứng minh rằng với một hàm phân phối (hoặc hàm phân phối khối lượng, mật độ hoặc tích lũy), tồn tại một không gian xác suất với một biến ngẫu nhiên có phân phối này. Do đó, về cơ bản không có sự khác biệt khi nói về một phân phối, hoặc về một biến ngẫu nhiên có phân phối đó. Đó chỉ là vấn đề trọng tâm của một người.


3

Hãy là một không gian xác suất, chúng ta hãy ( X , B ) là một không gian đo lường được, và để cho X : Ω X là một hàm đo lường được, có nghĩa là X - 1 ( B ) = { ω : X ( ω ) B } F cho mỗi B B . Các phân phối của X là thước đo khả năng μ(Ω,F,P)(X,B)X:ΩXX1(B)={ω:X(ω)B}FBB X trên ( X , B ) được xác định bởi μ X ( B ) = P ( X B ) . Khi X = R B là trường sigma Borel, chúng ta gọi hàm X là một "biến" ngẫu nhiên.μX(X,B)μX(B)=P(XB)X=RBX


1
phải rất rõ ràng với những người có ít kiến ​​thức về xác suất và thống kê :)
Alexey Grigorev

3
Chà, OP dường như biết các công cụ toán học tiên tiến như "phần tử của không gian kép của bộ sưu tập các hàm kiểm tra được trang bị cấu trúc liên kết giới hạn quy nạp". Kiểm tra kết thúc câu hỏi của anh ấy.
Zen

2
Đó thực sự là một phản ứng tốt cho tôi. Tôi cần kiểm tra định nghĩa của một không gian xác suất, nhưng đối với một người có nền tảng toán học, điều đó đã rõ ràng. Tôi đánh giá cao sự đồng tình của câu trả lời, chỉ không chấp nhận nó do chi tiết trong câu trả lời khác.
danzibr

1

Câu hỏi và câu trả lời cho đến nay dường như đã tập trung vào phân phối lý thuyết. Phân phối theo kinh nghiệm cung cấp một sự hiểu biết trực quan hơn về phân phối.

Thí dụ

Trong một giải đấu của lớp trong việc nhảy dây, chúng tôi quan sát tất cả những đứa trẻ trong một lớp nhảy dây. Đứa trẻ đầu tiên có thể nhảy hai lần, lần thứ hai bốn lần, lần tiếp theo mười lăm lần, v.v. Chúng tôi ghi lại số lần nhảy. Năm trong số những đứa trẻ nhảy tám lần mỗi lần, nhưng chỉ một trong số những đứa trẻ nhảy hai lần. Chúng tôi nói rằng nhảy tám lần được phân phối khác với nhảy hai lần.

Một định nghĩa phô trương cho một phân phối được quan sát là tần suất xuất hiện cho mỗi giá trị quan sát của một biến.

Trong các thống kê suy luận, sau đó chúng tôi cố gắng phù hợp với các phân phối lý thuyết cho các phân phối được quan sát, bởi vì chúng tôi muốn làm việc với các giả định của các phân phối lý thuyết. Bạn có thể đạt được một định nghĩa tương tự cho các phân phối lý thuyết bằng cách thay thế "quan sát" bằng "quan sát được" hoặc chính xác hơn: "mong đợi".

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.