Giải thích trực quan cho mật độ của biến đổi?


37

Giả sử là một biến ngẫu nhiên với pdf . Khi đó biến ngẫu nhiên có pdfXfX(x)Y=X2

fY(y)={12y(fX(y)+fX(y))y00y<0

Tôi hiểu các tính toán đằng sau này. Nhưng tôi đang cố nghĩ cách giải thích cho ai đó không biết tính toán. Cụ thể, tôi đang cố gắng giải thích tại sao yếu tố xuất hiện ở phía trước. Tôi sẽ đâm vào nó:1y

Giả sử có phân phối Gaussian. Hầu như tất cả trọng lượng của pdf của nó là giữa các giá trị, chẳng hạn, và Nhưng điều đó bản đồ để 0-9 cho . Vì vậy, trọng lượng nặng trong pdf cho đã được mở rộng trên một phạm vi rộng lớn hơn của giá trị trong việc chuyển đổi sang . Do đó, để là một pdf thực sự, trọng lượng cực lớn phải được giảm trọng lượng bởi hệ số nhânX33.YXYfY(y)1y

Nghe như thế nào?

Nếu bất cứ ai có thể cung cấp một lời giải thích tốt hơn của riêng họ hoặc liên kết với một trong tài liệu hoặc sách giáo khoa, tôi sẽ đánh giá rất cao nó. Tôi tìm thấy ví dụ biến đổi biến này trong một số sách xác suất / thống kê toán học giới thiệu. Nhưng tôi không bao giờ tìm thấy một lời giải thích trực quan với nó :(


Tôi nghĩ rằng lời giải thích của bạn là chính xác.
highBandWidth

2
Giải thích là đúng, nhưng nó hoàn toàn là định tính: hình thức chính xác của yếu tố nhân vẫn là một bí ẩn. Sức mạnh -1/2 đơn giản xuất hiện một cách kỳ diệu. Do đó, ở một mức độ nào đó, bạn phải làm điều tương tự như tính toán: tìm tốc độ thay đổi của hàm căn bậc hai.
whuber

Câu trả lời:


37

Các tệp PDF có chiều cao nhưng chúng được sử dụng để thể hiện xác suất bằng phương tiện diện tích. Do đó, nó giúp thể hiện một tệp PDF theo cách nhắc nhở chúng ta rằng diện tích bằng với chiều cao cơ sở thời gian.

Ban đầu chiều cao ở bất kỳ giá trị x được đưa ra bởi PDF fX(x) . Cơ sở là phân đoạn vô hạn dx , từ đó phân phối (nghĩa là thước đo xác suất trái ngược với hàm phân phối ) thực sự là dạng vi phân, hay "phần tử xác suất",

PEX(x)=fX(x)dx.

Đây, chứ không phải PDF, là đối tượng bạn muốn làm việc với cả khái niệm và thực tế, bởi vì nó bao gồm rõ ràng tất cả các yếu tố cần thiết để thể hiện một xác suất.

Khi chúng ta biểu thị lại x theo y=x2 , các phân đoạn cơ sở bị kéo dài (hoặc bị nén): bằng cách bình phương cả hai đầu của khoảng từ đến x + d x, chúng ta thấy rằng cơ sở của khu vực y phải một khoảng thời giandxxx+dxy

dy=(x+dx)2x2=2xdx+(dx)2.

Bởi vì sản phẩm của hai infinitesimals không đáng kể so với chính infinitesimals, chúng tôi kết luận

dy=2xdx, whence dx=dy2x=dy2y.

Đã thiết lập điều này, việc tính toán là không đáng kể vì chúng ta chỉ cần cắm chiều cao mới và chiều rộng mới:

PEX(x)=fX(x)dx=fX(y)dy2y=PEY(y).

Bởi vì cơ sở, về mặt y , là dy , bất kỳ số nhân nào cũng phải là chiều cao, mà chúng ta có thể đọc trực tiếp từ giữa kỳ như

12yfX(y)=fY(y).

Phương trình này PEX(x)=PEY(y) là một định luật bảo toàn diện tích (= xác suất).

Hai bản pdf

Đồ họa này hiển thị chính xác các phần hẹp (gần như vô hạn) của hai tệp PDF có liên quan bởi y=x2 . Xác suất được đại diện bởi các khu vực bóng mờ. Do việc nén khoảng [0.32,0.45] qua bình phương, chiều cao của vùng màu đỏ ( y , ở bên trái) phải được mở rộng theo tỷ lệ để phù hợp với diện tích của vùng màu xanh ( x , ở bên phải).


2
Tôi yêu infinitesimals. Đây là một lời giải thích tuyệt vời. Suy nghĩ trong điều khoản của , có thể được nhìn thấy rõ ràng nổi lên từ đạo hàm của biến đổi, là trực quan hơn nhiều so với suy nghĩ về những 2x . Tôi nghĩ đó là điểm gắn bó của tôi. y
lowndrul

@whuber, tôi tin bạn dòng đầu tiên phải là ? Đó có phải là ý của bạn bởi pdf X ( x ) ? PS: cũng tò mò về suy nghĩ của bạn về câu trả lời của tôi (bên dưới). P(X(x,x+dx))=fx(x)dxpdfX(x)
Carlos Cinelli

@Carlos Thật khó khăn hơn một chút để diễn đạt ý tưởng theo cách tôi đã làm ngay từ đầu: PDF là thứ bạn nhân số đo Lebesgue để có được số đo xác suất đã cho. dx
whuber

@whuber nhưng nếu pdf là những gì bạn nhân thì đó là thuật ngữ , không phải là sản phẩm f x ( x ) d x như bạn đã viết, phải không? Không rõ tại sao bạn gọi sản phẩm f X ( x ) d x là pdf. fX(x)fx(x)dxfX(x)dx
Carlos Cinelli

1
@Carlos: cảm ơn bạn; bây giờ tôi thấy quan điểm của bạn Tôi đã thực hiện một số chỉnh sửa để giải quyết nó.
whuber

11

Làm thế nào về, nếu tôi sản xuất các đối tượng luôn luôn vuông và tôi biết phân phối độ dài cạnh của hình vuông; Tôi có thể nói gì về sự phân bố các khu vực của hình vuông?

Cụ thể, nếu tôi biết phân phối của một biến ngẫu nhiên , tôi có thể nói gì về Y = X 2 ? Một điều mà bạn có thể nói làXY=X2

FY(c)=P(Yc)=P(X2c)=P(cXc)=FX(c)FX(c).

Vì vậy, mối quan hệ được thiết lập giữa CDF của và CDF của X ; mối quan hệ giữa các tệp PDF của họ là gì? Chúng ta cần tính toán cho điều đó. Lấy các dẫn xuất của cả hai bên cho bạn kết quả bạn muốn.YX


2
(+1) Mặc dù đây không phải là một câu trả lời đầy đủ, nhưng đây là một cách hay để tìm kiếm và cho thấy rõ lý do tại sao nó là tổng của hai mảnh, một cho mỗi căn bậc hai. fY
whuber

1
Tôi không hiểu tại sao pdf (x) = f (x) dx. Thế còn pdf (x) dx = f (x), density = prob mass/interval... tôi đang hiểu sai điều gì?
Fernando

2

Hãy tưởng tượng chúng ta có một dân số và Y là một bản tóm tắt về dân số đó. Khi đó P(Y(y,y+Δy)) đang đếm tỷ lệ các cá nhân có biến Y trong phạm vi (y,y+Δy) . Bạn có thể xem xét việc này như là một "bin" của kích thước Δy và chúng tôi đang đếm có bao nhiêu cá nhân là bên trong thùng đó.

Bây giờ chúng ta lại thể hiện những cá nhân về một biến khác, X . Cho rằng chúng ta biết rằng YX có liên quan như Y=X2 , sự kiện Y(y,y+Δy) cũng giống như sự kiện X2(x2,(x+Δx)2) mà giống với sự kiện X(|x|,|x|+Δx) or X(|x|Δx,|x|) . Do đó, các cá thể trong thùng(y,y+Δy) cũng phải ở trong các thùng(|x|,|x|+Δx)(|x|Δx,|x|) . Nói cách khác, những thùng đó phải có cùng tỷ lệ cá nhân,

P(Y(y,y+Δy))=P(X(|x|,|x|+Δx))+P(X(|x|Δx,|x|))

Ok, bây giờ hãy đến mật độ. Đầu tiên, chúng ta cần xác định mật độ xác suất là gì. Như tên cho thấy, nó là tỷ lệ của các cá nhân trên mỗi khu vực . Đó là, chúng tôi đếm phần của các cá nhân trên thùng đó và chia cho kích thước của thùng . Vì chúng tôi đã xác định rằng tỷ lệ của mọi người là như nhau ở đây, nhưng kích thước của các thùng đã thay đổi, chúng tôi kết luận mật độ sẽ khác nhau. Nhưng khác nhau bao nhiêu?

Như chúng ta đã nói, mật độ xác suất là tỷ lệ người trong thùng chia cho kích thước của thùng, do đó mật độ của Y được cho bởi fY(y):=P(Y(y,y+Δy))Δy . Tương tự, mật độ xác suất củaXđược cho bởifX(x):=P(X(x,x+Δx))Δx .

Từ kết quả trước đó của chúng tôi rằng dân số trong mỗi thùng là như nhau, sau đó chúng tôi có điều đó,

fY(y):=P(Y(y,y+Δy))Δy=P(X(|x|,|x|+Δx))+P(X(|x|Δx,|x|))Δy=fX(|x|)Δx+fX(|x|)ΔxΔy=ΔxΔy(fX(|x|)+fX(|x|))=ΔxΔy(fX(y)+fX(y))

fX(y)+fX(y)ΔxΔy , là kích thước tương đối của việc kéo dài hoặc ép kích thước thùng. Trong trường hợp của chúng tôi, vìy=x2y+Δy=(x+Δx)2=x2+2xΔx+Δx2ΔxΔx2Δy=2xΔxΔxΔy=12x=12y12y

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.