Sự phân bố khoảng cách Euclide giữa hai biến ngẫu nhiên phân phối bình thường là gì?


41

Giả sử bạn được cung cấp hai đối tượng có vị trí chính xác không xác định, nhưng được phân phối theo phân phối bình thường với các tham số đã biết (ví dụ: và . Chúng ta có thể giả sử đây là cả hai quy tắc bivariate, sao cho các vị trí được mô tả bởi một phân phối trên tọa độ ( (tức là và là các vectơ chứa tọa độ dự kiến cho và tương ứng). Chúng tôi cũng sẽ cho rằng các đối tượng là độc lập.b N ( v , t ) ) ( x , y ) m v ( x , y ) a baN(m,s)bN(v,t))(x,y)mv(x,y)ab

Có ai biết nếu phân phối khoảng cách Euclide bình phương giữa hai đối tượng này là một phân phối tham số đã biết? Hoặc làm thế nào để lấy được PDF / CDF cho chức năng này một cách phân tích?


4
Bạn nên lấy bội số của một phân phối chi bình phương không trung tâm với điều kiện cả bốn tọa độ đều không tương thích. Nếu không, kết quả có vẻ phức tạp hơn nhiều.
whuber

@whuber bất kỳ chi tiết / con trỏ nào bạn có thể cung cấp về cách các tham số của phân phối chi bình phương không trung tâm liên quan đến các đối tượng a, b sẽ rất tuyệt vời
Nick

4
@Nick vài đoạn đầu tiên của bài viết Wikipedia cung cấp các chi tiết. Bằng cách xem xét các hàm đặc trưng, ​​bạn có thể xác định rằng không có kết quả tương tự khi không phải tất cả các phương sai đều giống nhau hoặc có một số tương quan.
whuber

@Nick, chỉ cần làm rõ, cả và là các vectơ ngẫu nhiên có giá trị trong ? b R 2abR2
mpiktas

1
@Nick, nếu và là bình thường, thì sự khác biệt là cũng bình thường. Sau đó, vấn đề của bạn là tìm phân phối của vector bình thường ngẫu nhiên. Googling tôi tìm thấy liên kết này . Bài viết mô tả vấn đề phức tạp hơn nhiều trong trường hợp rất đặc biệt trùng khớp với bạn. Điều này mang lại một số hy vọng rằng có một câu trả lời chắc chắn cho câu hỏi của bạn. Tài liệu tham khảo có thể cung cấp cho bạn thêm ý tưởng nơi tìm kiếm. b a - babab
mpiktas

Câu trả lời:


24

Câu trả lời cho câu hỏi này có thể được tìm thấy trong cuốn sách Các dạng bậc hai trong các biến ngẫu nhiên của Mathai và Provost (1992, Marcel Dekker, Inc.).

Khi các ý kiến ​​làm rõ, bạn cần tìm phân phối của trong đó tuân theo phân phối chuẩn bivariate với ma trận trung bình và hiệp phương sai . Đây là một hình thức bậc hai trong biến ngẫu nhiên bivariate . z = một - b L Σ zQ=z12+z22z=abμΣz

Tóm lại, một kết quả tốt đẹp chung cho trường hợp chiều nơi và là chức năng tạo ra khoảnh khắc là trong đó là các giá trị riêng của và là hàm tuyến tính của . Xem Định lý 3.2a.2 (trang 42) trong cuốn sách được trích dẫn ở trên (chúng tôi giả sử ở đây rằng là số ít). Một đại diện hữu ích khác là 3.1a.1 (trang 29) trong đóz N p ( μ , Σ ) Q = p j = 1 z 2 j E ( e t Q ) = e t p j = 1 b 2 j λ jpzNp(μ,Σ)

Q=j=1pzj2
λ1,...,λpΣbLΣQ=pΣj=1λj(uj+bj)2u1,...,upN(0
E(etQ)=etj=1pbj2λj12tλjj=1p(12tλj)1/2
λ1,,λpΣbμΣ
Q=j=1pλj(uj+bj)2
u1,,up là iid .N(0,1)

Toàn bộ Chương 4 trong cuốn sách được dành cho việc thể hiện và tính toán mật độ và chức năng phân phối, điều này hoàn toàn không tầm thường. Tôi chỉ quen thuộc một cách hời hợt với cuốn sách, nhưng ấn tượng của tôi là tất cả các đại diện chung là về mặt mở rộng chuỗi vô hạn.

Vì vậy, theo một cách nào đó, câu trả lời cho câu hỏi là, vâng, sự phân bố khoảng cách euclide bình phương giữa hai vectơ bình thường bivariate thuộc về một lớp phân phối đã biết (và được nghiên cứu kỹ) được tham số hóa bởi bốn tham số và . Tuy nhiên, tôi khá chắc chắn rằng bạn sẽ không tìm thấy bản phân phối này trong sách giáo khoa tiêu chuẩn của mình.λ1,λ2>0b1,b2R

Lưu ý, hơn nữa, và không cần phải độc lập. Tính quy phạm chung là đủ (là tự động nếu chúng độc lập và mỗi bình thường), thì sự khác biệt tuân theo phân phối chuẩn.abab


1
Cảm ơn đã tham khảo, tôi đã tìm thấy cuốn sách và đang dần cố gắng vượt qua nó
Nick

@NRH Tôi đã tự mình làm việc thông qua MGF trong trường hợp đối xứng ( ) trong đó và thay vì trong tổng kết, tôi có . Mô phỏng xác minh khoảnh khắc đầu tiên. Có thể đây là "hàm tuyến tính" mà bạn đề cập và đây là đặc thù của trường hợp đối xứng, nhưng tôi nghĩ tôi đã chỉ ra nó trong trường hợp có lỗi. λj=σ2p=2bj2λjμj2
kyle

Trên thực tế, dựa trên định nghĩa của họ về , tử số theo hàm mũ sẽ giảm xuống còn trong trường hợp đối xứng (kích thước độc lập với phương sai chung). bjμj2
kyle

7

Trước tiên, hãy xác định phân phối hai biến của vectơ chênh lệch, , sẽ chỉ đơn giản là ; điều này xuất phát từ sự lan truyền độ không đảm bảo đa biến , liên quan đến ma trận đường chéo khối và Jacobian .Σ d = Σ 1 + Σ 2 Σ d = J Σ 12 J T Σ 12 = [ Σ 1μd=μ1μ2Σd=Σ1+Σ2 Σd=JΣ12JTJ=[ + I , - Tôi ]Σ12=[Σ1Σ2]J=[+I,I]

Thứ hai, tìm phân bố độ dài vectơ chênh lệch hoặc khoảng cách xuyên tâm từ gốc tọa độ được phân phối Hoyt :

Bán kính xung quanh giá trị trung bình thực trong một biến ngẫu nhiên bình thường tương quan bivariate với phương sai không bằng nhau, được viết lại theo tọa độ cực (bán kính và góc), theo phân phối Hoyt. Pdf và cdf được định nghĩa ở dạng đóng, tìm kiếm gốc số được sử dụng để tìm cdf ^ 1. Giảm phân phối Rayleigh nếu tương quan bằng 0 và phương sai bằng nhau.

Một phân phối tổng quát hơn phát sinh nếu bạn cho phép một sự khác biệt thiên vị (nguồn gốc thay đổi), từ Ballistipedia : Phân phối tọa độ xy và lỗi xuyên tâm kết quả


2
+1, nhưng tôi nghĩ rằng đáng để chỉ ra rằng câu hỏi liên quan đến cái mà con số của bạn gọi là "Trường hợp chung".
amip nói phục hồi Monica

1

Tại sao không kiểm tra nó ra?

set.seed(347)
x <- rnorm(10000)
y <- rnorm(10000)
x2 <- rnorm(10000)
y2 <- rnorm(10000)

qdf <- data.frame(x,y,x2,y2)
qdf <- data.frame(qdf,(x-x2)^2+(y-y2)^2)
colnames(qdf)[5] <- "euclid" 

plot(c(x,y),c(x2,y2))
plot(qdf$euclid)
hist(qdf$euclid) 
plot(dentist(qdf$euclid))

Lô 1 Lô 2 Lô 3 Lô 4


2
những người bình luận cho câu hỏi ban đầu đã cho biết nó sẽ trông như thế nào nếu phương sai giống nhau và các biến không tương quan. Có lẽ đưa ra một ví dụ về trường hợp này không phải là trường hợp sẽ được khai sáng hơn.
Andy W

Bạn có thể cung cấp một ví dụ như vậy?
Brandon Bertelsen

tất cả những gì bạn cần làm là tạo ra các giá trị x và y tương quan hoặc có các phương sai khác nhau. Các phương sai khác nhau có thể được thực hiện ngay trong mã. Bạn có thể tạo các giá trị từ một ma trận hiệp phương sai được chỉ định bằng cách sử dụng mvrnorm từ gói MASS. Ngoài ra tôi không chắc chức năng "nha sĩ" trong đoạn mã trên là gì, có lẽ nên là "mật độ".
Andy W

1
Điều đó được nói có lẽ chỉ là khai sáng để làm việc thông qua toán học để xem tại sao lại như vậy (và cách thao túng phương sai / hiệp phương sai sẽ thay đổi phân phối). Nó không hoàn toàn rõ ràng đối với tôi tại sao đây là trường hợp chỉ bằng cách nhìn vào chức năng đặc trưng được đề cập bởi whuber. Dường như một sự hiểu biết đơn giản về các quy tắc để thêm, trừ và nhân các biến ngẫu nhiên sẽ giúp bạn hiểu được lý do tại sao.
Andy W
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.