Điều này có đúng không? (tạo ra một Traussated-Norm-multivariate-Gaussian)


10

Nếu tức là XRn, XN(0_,σ2I)

fX(x)=1(2πσ2)n/2exp(||x||22σ2)

Tôi muốn một phiên bản tương tự của phân phối cắt ngắn-bình thường trong trường hợp đa biến.

Chính xác hơn, tôi muốn tạo một ràng buộc định mức (đến một giá trị ) đa biến Gaussian Y st f_Y (y) = \ started {case} c.f_X (y), \ text {if} || y || \ geq a \\ [2 mm] 0, \ text {nếu không}. \ end {case} trong đó c = \ frac {1} {Prob \ big \ {|| X || \ geq a \ big \}}aY

fY(y)={c.fX(y), if ||y||a0, otherwise .
c=1Prob{||X||a}

Bây giờ tôi quan sát như sau:

Nếu x=(x1,x2,,xn) , ||x||a

|xn|Tmax(0,(a21n1xi2))

Do đó, bằng cách chọn x1,,xn1 làm mẫu Gaussian, người ta có thể hạn chế xn làm mẫu trong phân phối cắt ngắn (theo phân phối Gaussian-tail T ) NT(0,σ2) , ngoại trừ dấu hiệu được chọn ngẫu nhiên với xác suất 1/2 .

Bây giờ câu hỏi của tôi là điều này,

Nếu tôi tạo từng mẫu vectơ (x1,,xn) của (X1,,Xn) là,

x1,,xn1N(0,σ2)

Z 1{ ± 1 w.p. 1 / 2 } Z 2 ~ N T ( 0 , σ 2 )xn=Z1Z2  ở đâu, , , (tức là a RV cắt ngắn vô hướng với Z1{±1 w.p. 1/2}Z2NT(0,σ2)T(x1,,xn1)max(0,(a21n1xi2))

Sẽ là một tiêu chuẩn-bị hạn chế ( ) đa biến Gaussian? (tức là giống như định nghĩa ở trên). Tôi nên xác minh như thế nào? Bất kỳ đề nghị khác nếu đây không phải là cách?một Y(X1,X2,,Xn)aY

BIÊN TẬP:

Dưới đây là biểu đồ phân tán các điểm trong trường hợp 2D với chỉ tiêu bị cắt cụt thành các giá trị trên "1" Gaussian đa biến cắt ngắn

Lưu ý: Có một số câu trả lời tuyệt vời dưới đây, nhưng lý do tại sao đề xuất này sai là thiếu. Trong thực tế, đó là điểm chính của câu hỏi này.


1
@ Xi'an Cảm ơn câu hỏi và sự quan tâm của bạn. Đây là lý do của tôi cho quan điểm của bạn: Thuật toán trong câu hỏi cần RVs , đó là Gaussian và Truncated-Gaussian khi chúng được nhìn thấy trên mỗi mẫu ; cụ thể hơn, một trong những bản phân phối thay đổi mỗi mẫu. Họ không phải là lề tương ứng. Bởi vì, mỗi xuất hiện theo hai thuật ngữ: và ; và rõ ràng là thời gian khác nhau khi ngưỡng cắt ngắn khác nhau cho mỗi mẫu. Bằng chứng phân rã mà bạn cung cấp có một vấn đề theo cùng một nghĩa. Ký quỹ chỉ là không có sẵn. n - 1 x i , i = 1 , ... , n - 1 x i x n x nX1Xnn1xi,i=1,,n1xixnxn
Yêu xác suất

Thuật toán (không chính xác) của bạn tạo trước rồi sau đó là cho . Do đó, thế hệ thứ nhất là từ biên và thế hệ thứ hai là từ điều kiện. Bằng chứng của tôi cho thấy biên không phải là phân phối Gaussian (n-1) chiều. X n ~ N T ( 0 , σ 2 ) X 1 , ... , X n - 1
X1,,Xn1N(0,σ2)
XnNT(0,σ2)
X1,,Xn1
Tây An

@ Xi'an Gaussian có điều kiện không có nghĩa là Gaussian cận biên !!
Yêu xác suất

@ Xi'an Được rồi, quan điểm của tôi là thế này. Khi được tạo dưới dạng Gaussian và các thuật ngữ sau này phụ thuộc vào các giá trị này, các lề của sẽ không phải là Gaussian. Những gì bạn nói là hoàn toàn giống nhau. Chúng có thể là "Gaussian có điều kiện" nhưng chắc chắn không phải là "Gaussian bên lề". Nhận xét trước đó của tôi có nghĩa là. X 1 , Mạnh , X n - 1X1,,Xn1X1,,Xn1
Yêu xác suất

1
@ Xi'an Cảm ơn rất nhiều cho câu trả lời bệnh nhân của bạn. Cuối cùng tôi đã hiểu sai lầm của mình với sự kích thích của bạn, và tôi cũng đã viết câu trả lời chi tiết của riêng mình giải thích tương tự. Nhưng xin lỗi, hy vọng bạn không phiền, tôi có lẽ nên chấp nhận câu trả lời của người cho lời giải thích chi tiết của anh ấy giúp giải quyết vấn đề thực sự.
Yêu xác suất

Câu trả lời:


11

Phân phối chuẩn đa biến đối xứng hình cầu. Phân phối mà bạn tìm kiếm cắt ngắn bán kính bên dưới tại . Bởi vì tiêu chí này chỉ phụ thuộc vào độ dài của , phân phối bị cắt cụt vẫn đối xứng hình cầu. Vì độc lập với góc hình cầuvà có phân phối , do đó bạn có thể tạo các giá trị từ phân phối bị cắt chỉ bằng một vài bước đơn giản:ρ = | | X | | 2Xρ=||X||2XaXX / | | X | | ρρX/||X||χ ( n )ρσχ(n)

  1. Tạo .XN(0,In)

  2. Tạo là căn bậc hai của phân phối bị cắt ở .P( một / σ ) 2χ2(d)(a/σ)2

  3. Đặt.Y=σPX/||X||

Trong bước 1, thu được dưới dạng một chuỗi các thực hiện độc lập của một biến thông thường tiêu chuẩn.dXd

Trong bước 2, dễ dàng được tạo bằng cách đảo ngược hàm lượng tử của phân phối : tạo một biến thống nhất được hỗ trợ trong phạm vi (của lượng tử) giữa và và đặt .F - 1 χ 2 ( d ) U FPF1χ2(d)U1 P = F((a/σ)2)1P=F(U)

Dưới đây là biểu đồ gồm nhận thức độc lập như vậy của cho trong nguyên, được cắt dưới đây tại . Phải mất khoảng một giây để tạo ra, chứng thực tính hiệu quả của thuật toán. σ P105σPσ=3một = 7n=11a=7

Nhân vật

Đường cong màu đỏ là mật độ của phân phối bị cắt bớt được chia tỷ lệ theo . Sự phù hợp chặt chẽ của nó với biểu đồ là bằng chứng về tính hợp lệ của kỹ thuật này.σ = 3χ(11)σ=3

Để có được trực giác cho việc cắt ngắn, hãy xem xét trường hợp , trong nguyên. Đây là một biểu đồ phân tán của so với (cho hiện thực độc lập). Nó cho thấy rõ lỗ ở bán kính :σ = 1 n = 2 Y 2a=3σ=1n=2Y2Y1 một104a

Hình 2

Cuối cùng, lưu ý rằng (1) các thành phần phải có các phân phối giống hệt nhau (do tính đối xứng hình cầu) và (2) ngoại trừ khi , phân phối chung đó không bình thường. Trong thực tế, như phát triển lớn, sự sụt giảm nhanh chóng của (đơn biến) phân phối bình thường gây ra hầu hết các khả năng của đa biến hình cầu cắt ngắn bình thường chụm lại gần bề mặt của -sphere (bán kính ). Do đó, phân phối biên phải xấp xỉ phân phối Beta đối xứng tập trung trong khoảng . Điều này là rõ ràng trong biểu đồ phân tán trước, trong đó a = 0 a n - 1 a ( ( n - 1 ) / 2 , ( n - 1 ) / 2 ) ( - a , a ) a = 3 σ 2 - 1Xia=0an1a((n1)/2,(n1)/2)(a,a)a=3σđã lớn ở hai chiều: các điểm giới hạn một vòng (một không gian ) bán kính .213σ

Dưới đây là biểu đồ của các phân phối biên từ mô phỏng kích thước trong chiều với , (trong đó phân phối Beta gần đúng ):1053a=10σ=1(1,1)

Hình 3

Vì các lề đầu tiên của quy trình được mô tả trong câu hỏi là bình thường (bằng cách xây dựng), quy trình đó không thể chính xác.n1


Đoạn Rmã sau tạo ra hình đầu tiên. Nó được xây dựng để bước song song 1-3 để tạo ra . Nó đã được sửa đổi để tạo ra các con số thứ hai bằng cách thay đổi biến , , , và rồi ban hành lệnh cốt truyện sau khi được tạo ra.Yadnsigmaplot(y[1,], y[2,], pch=16, cex=1/2, col="#00000010")y

Thế hệ của được sửa đổi trong mã cho độ phân giải cao hơn số: mã thực sự tạo và việc sử dụng đó để tính toán .U1UP

Kỹ thuật mô phỏng dữ liệu tương tự theo một thuật toán giả định, tóm tắt nó bằng biểu đồ và áp dụng biểu đồ có thể được sử dụng để kiểm tra phương pháp được mô tả trong câu hỏi. Nó sẽ xác nhận rằng phương pháp không hoạt động như mong đợi.

a <- 7      # Lower threshold
d <- 11     # Dimensions
n <- 1e5    # Sample size
sigma <- 3  # Original SD
#
# The algorithm.
#
set.seed(17)
u.max <- pchisq((a/sigma)^2, d, lower.tail=FALSE)
if (u.max == 0) stop("The threshold is too large.")
u <- runif(n, 0, u.max)
rho <- sigma * sqrt(qchisq(u, d, lower.tail=FALSE)) 
x <- matrix(rnorm(n*d, 0, 1), ncol=d)
y <- t(x * rho / apply(x, 1, function(y) sqrt(sum(y*y))))
#
# Draw histograms of the marginal distributions.
#
h <- function(z) {
  s <- sd(z)
  hist(z, freq=FALSE, ylim=c(0, 1/sqrt(2*pi*s^2)),
       main="Marginal Histogram",
       sub="Best Normal Fit Superimposed")
  curve(dnorm(x, mean(z), s), add=TRUE, lwd=2, col="Red")
}
par(mfrow=c(1, min(d, 4)))
invisible(apply(y, 1, h))
#
# Draw a nice histogram of the distances.
#
#plot(y[1,], y[2,], pch=16, cex=1/2, col="#00000010") # For figure 2
rho.max <- min(qchisq(1 - 0.001*pchisq(a/sigma, d, lower.tail=FALSE), d)*sigma, 
               max(rho), na.rm=TRUE)
k <- ceiling(rho.max/a)
hist(rho, freq=FALSE, xlim=c(0, rho.max),  
     breaks=seq(0, max(rho)+a, by=a/ceiling(50/k)))
#
# Superimpose the theoretical distribution.
#
dchi <- function(x, d) {
  exp((d-1)*log(x) + (1-d/2)*log(2) - x^2/2 - lgamma(d/2))
}
curve((x >= a)*dchi(x/sigma, d) / (1-pchisq((a/sigma)^2, d))/sigma, add=TRUE, 
      lwd=2, col="Red", n=257)

1
Đó là một câu trả lời tuyệt vời! Nhưng, bạn cũng có thể vui lòng đưa ra một số ánh sáng về lý do tại sao đề xuất trong câu hỏi không thành công? (Câu trả lời của Xi'an không đủ thỏa đáng. Tôi thấy một số vấn đề với lập luận của anh ấy, ví dụ như khi anh ấy hòa nhập)
Yêu xác suất

1
Cảm ơn rât nhiều. Nhưng, tôi cũng có thể yêu cầu bạn trả lời về nhận xét đầu tiên của tôi ở trên không? Có vẻ như, đề xuất của tôi cũng cho một biểu đồ tốt gần đủ. Tôi bị bối rối!! Lỗi ở đâu? Lưu ý rằng, đây là điểm chính của câu hỏi và NẾU ĐÚNG , phương pháp chỉ cần một mẫu "cắt ngắn-Gaussian" Với sự sẵn có của các thuật toán nhanh hiện có, nó dẫn đến một khoản tiết kiệm rất lớn (tránh sự chia rẽ và nhân lên, ngoài ra tránh sự cần thiết của việc cắt ngắn tương đối phức tạp hơn - ChiSapes)
Yêu xác suất

2
Theo như tôi có thể nói, bạn đề xuất vẽ iid từ một bản phân phối Bình thường và từ một Bình thường cắt ngắn hai mặt. Đó rõ ràng không phải là một bản phân phối MVN bị cắt ngắn, vì một biểu đồ phân tán cho sẽ dễ dàng tiết lộ, rằng tôi tin rằng tôi đã không thể hiểu được phần đó câu hỏi của bạn. Tổng quát hơn, gánh nặng của những câu hỏi mà hỏi tại sao một cái gì đó không không làm việc là trên hỏi để cung cấp bằng chứng cho thấy nó không làm việc. Có lẽ nếu bạn cung cấp bằng chứng như vậy, bản chất của câu hỏi của bạn sẽ trở nên rõ ràng. X1,,Xn1Xnn=2
whuber

1
Cảm ơn các chi tiết. Tôi đã thêm một biểu đồ phân tán 2 chiều như bạn đã nói và sửa một vài câu. Nhân tiện, xin lỗi tôi không thực sự muốn chuyển toàn bộ gánh nặng bằng chứng cho bạn. Đề xuất của tôi dường như hoạt động tốt với tất cả các kiểm tra đơn giản, do đó tôi tò mò tại sao nó sai, đó cũng là mục đích chính của câu hỏi này.
Yêu xác suất

1
Nhìn vào các phân phối cận biên là cách đơn giản nhất mà tôi có thể tìm thấy để minh họa sự khác biệt trong các thủ tục. Tôi đã thêm một con số và một số mã để hiển thị các lề này.
whuber

7

Tôi đã viết điều này giả sử rằng bạn không muốn có bất kỳ điểm nào có | | y | | > a, đó là sự tương tự của việc cắt ngắn một chiều thông thường. Tuy nhiên, bạn đã viết rằng bạn muốn giữ điểm có | y | | > = a và ném ra những người khác. Tuy nhiên, điều chỉnh rõ ràng cho giải pháp của tôi có thể được thực hiện nếu bạn thực sự muốn giữ điểm có | y | | > = a.

Cách đơn giản nhất, vốn là một kỹ thuật rất chung chung, là sử dụng Chấp nhận-Từ chối https://en.wikipedia.org/wiki/Rejection_sampling . Nó sẽ khá nhanh miễn là Prob (| | X ||> a) khá thấp, vì sau đó sẽ không có nhiều từ chối.

Tạo một giá trị mẫu x từ Bình thường đa biến không giới hạn (mặc dù vấn đề của bạn nói rằng Đa biến thông thường là hình cầu, kỹ thuật có thể được áp dụng ngay cả khi không phải vậy). Nếu | | x | | <= a, chấp nhận, nghĩa là sử dụng x, nếu không thì từ chối nó và tạo một mẫu mới. Lặp lại quy trình này cho đến khi bạn có nhiều mẫu được chấp nhận như bạn cần. Tác dụng của việc áp dụng quy trình này là tạo ra y sao cho mật độ của nó là c * f_X (y), nếu | | y | | <= a và 0 nếu | | y | | > a, theo sự điều chỉnh của tôi đối với phần mở đầu của câu hỏi của bạn. Bạn không bao giờ cần phải tính c; nó có hiệu lực tự động được xác định bởi thuật toán dựa trên tần suất các mẫu bị từ chối.


3
+1 Tôi thích rằng đề xuất của bạn hoạt động với các MVN không đối xứng hình cầu, rằng bạn đã mô tả rõ ràng các trường hợp sẽ có hiệu lực và bạn nhấn mạnh sự cần thiết phải đánh giá tỷ lệ loại bỏ khi quyết định có nên sử dụng lấy mẫu từ chối hay không.
whuber

2
Có, và cũng lưu ý rằng nó có thể hoạt động cho (các) khu vực chấp nhận được định hình tùy ý, không chỉ 2 chỉ tiêu ở trên hoặc dưới ngưỡng như ở đây.
Mark L. Stone

5

fX(x)1(2πσ2)n/2exp(||x||22σ2)I||x||>a=1(2πσ2)n/2exp(x12++xn22σ2)I||x||>a
fX(x)1(2πσ2)(n1)/2exp(||xn||22σ2)1(2πσ2)1/2exp(xn22σ2)I||x||>a
=1(2πσ2)(n1)/2exp(||xn||22σ2)1(2πσ2)1/2exp(xn22σ2)I||xn||2+xn2>a2
=P(Xn2>a2||xn||2)(2πσ2)(n1)/2exp(||xn||22σ2)
×P(Xn2>a2||xn||2)1(2πσ2)1/2exp(xn22σ2)Ixn2>a||xn||2
fXn(xn)P(Xn2>a2||xn||2)(2πσ2)(n1)/2exp(||xn||22σ2)
xn
  1. XnXn
  2. XnP(Xn2>a2||xn||2)

Cách duy nhất tôi có thể thấy trong việc tận dụng lợi thế của tài sản này là chạy bộ lấy mẫu Gibbs, một thành phần tại một thời điểm, sử dụng các phân phối có điều kiện bình thường bị cắt cụt.


1
fX(x)

3

Câu hỏi bắt nguồn từ ý tưởng sử dụng - phân tách điều kiện cơ bản của các phân phối chung - để vẽ các mẫu vectơ.

X

Có lẽ(||X||>một)TYX.Tôi||X||>một

fY(y)=1T1(2πσ2)n/2exp(||y||22σ2)I||y||>a=1T1(2πσ2)n/2exp(y12++yn22σ2)I||y||>a=(i=1n112πσ2exp(yi22σ2))(1T12πσ2exp(yn22σ2)I||y||>a)=(i=1n112πσ2exp(yi22σ2))Gaussians(1T12πσ2exp(yn22σ2)Iyn2>(a2y12yn12))Truncated Gaussian??

Câu trả lời ngắn nhất là yếu tố sau không phải là một Gaussian bị cắt cụt, (quan trọng hơn) thậm chí không phải là một phân phối.


Dưới đây là lời giải thích chi tiết về lý do tại sao chính yếu tố trên có một số lỗ hổng cơ bản. Trong một câu duy nhất: mọi yếu tố có điều kiện của phân phối chung nhất định phải đáp ứng một số tính chất rất cơ bản và yếu tố trên không thỏa mãn chúng (Xem bên dưới).

fXY(x,y)=fX(x)fY|X(y|x)fX(x)XfY|X(y|x)Y

  1. f(x,y)fX(x)
  2. fY|X(y|x)x

Yn|(Y1Yn1)

(Y1Yn1)


Một đề xuất thuật toán như vậy có lẽ là kết quả của quan niệm sai lầm sau: Một khi phân phối tự nhiên là các yếu tố ra khỏi phân phối chung (chẳng hạn như Gaussian ở trên), nó dẫn đến một yếu tố có điều kiện. ---- Không! ---- Yếu tố (thứ hai) khác cũng phải tốt.


Lưu ý: Có một câu trả lời tuyệt vời của @whuber trước đó, đó thực sự giải quyết được vấn đề tạo ra một Gaussian đa biến cắt ngắn định mức. Tôi chấp nhận câu trả lời của anh ấy. Câu trả lời này chỉ để làm rõ và chia sẻ sự hiểu biết của riêng tôi và nguồn gốc của câu hỏi.


2
+1 Cảm ơn bạn đã chia sẻ suy nghĩ của bạn: họ thêm cái nhìn sâu sắc có giá trị cho chủ đề này.
whuber
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.