Làm thế nào để tìm khoảng cách dự kiến ​​giữa hai điểm phân bố đồng đều?


9

Nếu tôi định nghĩa tọa độ và trong đó( X 2 , Y 2 )(X1,Y1)(X2,Y2)

X1,X2Unif(0,30) and Y1,Y2Unif(0,40).

Làm thế nào tôi có thể tìm thấy giá trị mong đợi của khoảng cách giữa chúng?

Tôi đã suy nghĩ, vì khoảng cách được tính bởi sẽ có giá trị mong đợi chỉ là ?(1/30+1/30)2+(1/40+1/40)2(X1X2)2+(Y1Y2)2)(1/30+1/30)2+(1/40+1/40)2


Mã LaTeX của bạn không được hiển thị chính xác. Tôi hy vọng sửa chữa của tôi là những gì bạn dự định
Peter Flom

Hầu như, nhưng cuối cùng nó đã giúp tôi đến đó, cảm ơn rất nhiều.
Toán

2
Câu hỏi tương đương trên trang web toán học: Khoảng cách trung bình giữa các điểm ngẫu nhiên trong một hình chữ nhật . Một câu hỏi liên quan: Xác suất các điểm ngẫu nhiên đồng nhất trong một hình chữ nhật có khoảng cách Euclide nhỏ hơn một ngưỡng nhất định . (Thật không may, tôi chưa bao giờ nhận được @whuber về các đề xuất của anh ấy ở đó. Tôi sẽ cố gắng tìm thời gian để làm điều đó.)
Đức Hồng Y

1
Cảm ơn những liên kết đó, @cardinal. Mặc dù phiên bản toán học không giải thích câu trả lời - nó chỉ trình bày nó - nó chứa các liên kết đến một dẫn xuất, rất đáng để xem xét.
whuber

Câu trả lời:


2
##problem
x <- runif(1000000,0,30)
y <- runif(1000000,0,40)
Uniform <- as.data.frame(cbind(x,y))
n <- nrow(Uniform)
catch <- rep(NA,n)
for (i in 2:n) {
      catch[i] <-((x[i+1]-x[i])^2 + (y[i+1]-y[i])^2)^.5
}
mean(catch, na.rm=TRUE)
18.35855

Nếu tôi hiểu chính xác những gì bạn đang tìm kiếm, có lẽ điều này sẽ giúp. Bạn đang cố gắng tìm ra khoảng cách giữa các điểm ngẫu nhiên, giá trị X của ai được tạo từ unif (0,30) và giá trị Y được tạo từ unif (0,40). Tôi vừa tạo một triệu RV từ mỗi phân phối đến phân phối và sau đó ràng buộc x và y để tạo điểm cho mỗi phân phối. Sau đó, tôi đã tính khoảng cách giữa điểm 2 và 1 cho đến khoảng cách giữa các điểm 1.000.000 và 999.999. Khoảng cách trung bình là 18.35855. Hãy cho tôi biết nếu đây không phải là những gì bạn đang tìm kiếm.


Mất tự do chỉnh sửa để định dạng.
tò mò_cat

2
Bạn đã đến khá gần - có lẽ là tình cờ. Câu trả lời đúng là = . Mã của bạn có hai vấn đề: (1) các lần lặp không độc lập lẫn nhau; và (2) để có được độ chính xác hợp lý, nó phải được mã hóa để nhanh hơn. Tại sao không làm mô phỏng trực tiếp, như trong . Điều đó sẽ giúp bạn có khoảng bốn con số đáng kể (trong thời gian ngắn hơn), vì bạn có thể kiểm tra bằng cách tính toán lỗi tiêu chuẩn . 18,345919...1108(871+960log(2)+405log(3))18.345919n <- 10^7; distance <- sqrt((runif(n,0,30)-runif(n,0,30))^2 + (runif(n,0,40)-runif(n,0,40))^2)sd(distance) / sqrt(n)
whuber

@whuber: Bạn có thể giải thích số 1 của bạn? ví dụ: nói (Trường hợp-I) Tôi đã rút ra các cặp số ngẫu nhiên từ bất kỳ phân phối nhất định nào và tính khác biệt và lấy giá trị trung bình. Versus (Case-II) Tôi tiếp tục vẽ một số tại một thời điểm và tiếp tục tính toán sự khác biệt liên quan đến lần rút số cuối cùng và sau đó tính trung bình. Trung bình được báo cáo bởi Case-I và Case-II có khác nhau một cách có hệ thống không?
tò mò_cat

1
@cantly_cat Không, trung bình sẽ giống nhau: nhưng cách tính sai số chuẩn sẽ khác nhau. Chúng ta cần tính toán đó để ước tính mức độ trung bình có thể đến với giá trị thực. Thay vì thực hiện phép tính SE phức tạp hơn, đơn giản hơn là chỉ tạo các cặp điểm hoàn toàn độc lập với nhau, chính xác như được quy định trong câu hỏi. (Có rất nhiều cách mô phỏng có thể sai - tôi biết từ kinh nghiệm! - rằng thật khôn ngoan khi làm cho mô phỏng bắt chước thực tế càng gần càng tốt.)
whuber

@whuber: Cảm ơn đã làm rõ. Vì vậy, nếu Clark đã chạy mã của mình lâu hơn, anh ta có thể đã nhận được nhiều số thập phân hơn phải không?
tò mò_cat

16

Thật đơn giản, khi nhìn vào câu hỏi về mặt hình học, khoảng cách dự kiến ​​giữa hai điểm ngẫu nhiên, đồng nhất, ngẫu nhiên trong một tập lồi sẽ nhỏ hơn một nửa đường kính của nó . (Nó phải là ít vì nó tương đối hiếm đối với hai điểm đến được bố trí trong phạm vi cực đoan như góc và thường xuyên hơn các trường hợp họ sẽ được ở gần trung tâm, nơi họ đang đóng.) Kể từ khi đường kính của hình chữ nhật này là , của thành viên này lý luận một mình chúng tôi sẽ dự đoán câu trả lời là ít hơn một chút .5025

Một câu trả lời chính xác có được từ định nghĩa của kỳ vọng là giá trị trọng số xác suất của khoảng cách. Nói chung, hãy xem xét một hình chữ nhật của các cạnh và ; chúng tôi sẽ mở rộng kích thước của nó lên đúng kích thước sau đó (bằng cách đặt và nhân số kỳ vọng lên ). Đối với hình chữ nhật này, sử dụng tọa độ , mật độ xác suất đồng nhất là . Khoảng cách trung bình trong hình chữ nhật này sau đó được cho bởi1λλ=40/3030(x,y)1λdxdy

0λ010λ01(x1x2)2+(y1y2)21λdx1dy11λdx2dy2.

Sử dụng các phương pháp tích hợp cơ bản, điều này rất đơn giản nhưng khó thực hiện; Tôi đã sử dụng một hệ thống đại số máy tính ( Mathematica ) để có được câu trả lời

[2+2λ521+λ2+6λ21+λ22λ41+λ2+5λArcSinh(λ)+5λ4log(1+1+λ2λ)]/(30λ2).

Sự hiện diện của trong nhiều điều khoản này không có gì đáng ngạc nhiên: đó là đường kính của hình chữ nhật (khoảng cách tối đa có thể giữa hai điểm bất kỳ trong đó). Sự xuất hiện của logarit (bao gồm cả arcsinh) cũng không có gì đáng ngạc nhiên nếu bạn đã từng điều tra khoảng cách trung bình trong các hình máy bay đơn giản: bằng cách nào đó nó luôn xuất hiện (một gợi ý này xuất hiện trong tích phân của hàm secant). Ngẫu nhiên, sự hiện diện của trong mẫu số không liên quan gì đến các chi tiết cụ thể của vấn đề liên quan đến một hình chữ nhật của các cạnh và : đó là một hằng số phổ quát.)1+λ2303040

Với và nhân rộng theo hệ số , điều này ước tính thành .30 1λ=4/3301108(871+960log(2)+405log(3))18.345919


Một cách để hiểu sâu hơn về tình huống này là vẽ khoảng cách trung bình tương ứng với đường kính của cho các giá trị khác nhau của . Đối với các giá trị cực trị (gần hoặc lớn hơn ), hình chữ nhật về cơ bản trở thành một chiều và tích hợp cơ bản hơn cho thấy khoảng cách trung bình sẽ giảm xuống một phần ba đường kính. Ngoài ra, vì hình dạng của hình chữ nhật với và là như nhau, nên việc vẽ kết quả theo thang logarit của , trong đó nó phải đối xứng với (hình vuông). Đây là: λ01λ1/λλλ=11+λ2λ01λ1/λλλ=1

Âm mưu

Với điều này, chúng ta học một quy tắc ngón tay cái : khoảng cách trung bình trong một hình chữ nhật nằm trong khoảng và (xấp xỉ) đường kính của nó, với các giá trị lớn hơn được liên kết với hình chữ nhật vuông và các giá trị nhỏ hơn liên quan đến gầy dài (tuyến tính ) hình chữ nhật. Điểm giữa giữa các cực trị này đạt được khoảng cho các hình chữ nhật có tỷ lệ khung hình là . Với quy tắc này, bạn có thể chỉ cần nhìn vào một hình chữ nhật và ước tính khoảng cách trung bình của nó đến hai con số quan trọng.0,37 3 : 11/30.330.373:1


Đó có nên là "đường chéo" thay vì "đường kính"? Xin lỗi nếu tôi đang nitpicking.
tò mò_cat

@cpered_cat Theo định nghĩa, đường kính của một tập hợp các điểm (trong bất kỳ không gian số liệu nào) là tối cao của khoảng cách giữa hai điểm bất kỳ trong đó. Đối với một hình chữ nhật, nó (rõ ràng) là chiều dài của một đường chéo.
whuber

Cảm ơn! Tôi đã không nhận ra rằng. Tôi đã sử dụng một khái niệm ngây thơ về đường kính.
tò mò_cat

Như một bên: Đối với tất cả các hình chữ nhật của khu vực nhất định, khoảng cách trung bình sẽ được giảm thiểu cho một hình vuông?
tò mò_cat

2
Theo tinh thần của điều này , tôi ước rằng bạn đã bắt đầu câu trả lời này với "Đó là máy bay ..." (+1)
hồng y
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.