Siêu thể tích của đường viền


8

Tôi đang tìm giá trị giả định ( ) của (nhật ký của yếu tố quyết định) hiệp phương sai của % các quan sát với khoảng cách Eucledian nhỏ nhất đến gốc trong một mẫu có kích thước được rút ra từ, giả sử , một Gaussian tiêu chuẩn bivariate.alpha nnαn

- Siêu âm lượng của một hình elip tỷ lệ thuận với yếu tố quyết định của ma trận hiệp phương sai của nó, do đó, tiêu đề .--

--Bạn Gaussian chuẩn bivariate, ý tôi là trong đó là một vectơ có độ dài 2 và là ma trận nhận dạng hạng 2 .---N2(02,II2)tôi02II2

Thật dễ dàng để xem bằng mô phỏng so với khi , con số nằm trong khoảng :- 1,28α=52/701.28

library(MASS)
n<-10000
p<-2
x<-mvrnorm(n,rep(0,p),diag(2))
h<-ceiling(0.714286*n)
p<-ncol(x)
w<-mahalanobis(x,rep(0,p),diag(p),inverted=TRUE) #These are eucledian distances, because the covariance used is the identity matrix
s<-(1:n)[order(w)][1:h]
log(det(cov(x[s,])))

nhưng tôi không nhớ làm thế nào để có được một biểu thức chính xác (hoặc không thành công, một xấp xỉ tốt hơn) cho điều này.


1
Trong văn bản của bạn, bạn không nói gì về các tham số của phân phối bivariate. Ngoài ra, có vẻ như mã của bạn là về Mahalanobis d, không phải Euclid d.
ttnphns

1
Theo gaussian tiêu chuẩn, tôi có nghĩa là một trung tâm ở gốc và với hiệp phương sai danh tính (tôi sẽ chỉnh sửa điều này trong). Khoảng cách Mahalanobis wrt đến ma trận hiệp phương sai danh tính == Khoảng cách Eucledian.
user603 18/07/14

1
Nếu bạn đang sử dụng mã hoặc tìm kiếm trợ giúp về mã, vui lòng cho biết ngôn ngữ hoặc chương trình bạn đang sử dụng.
sói

Câu trả lời:


7

Ok, câu hỏi này thỉnh thoảng xuất hiện vì vậy tôi sẽ đưa ra câu trả lời chung chung.

Trong [1], các tác giả cho thấy rằng nếu với xác định đối xứng dương vàΣ S αxxiNp(μμ,ΣΣ),i=1,,nΣSα

(0)Sα={i:(xxiμμ)Σ1(xxiμμ)qα}

cho vàqα=χp2(α),0<α1

(1)Cα=coviSαxxi

Sau đó, không có triệu chứng, hội tụ thành trong đó l α ΣCαlαΣ

(2)lα=Fχp+22(qα)α

Giá trị gần đúng này thực sự tốt (ở đây cho alpha = 60/70):

library(MASS)
alpha<-60/70
p<-2
n<-1000000

radius<-sqrt(qchisq(alpha,df=p))
x0<-mvrnorm(n,rep(0,p),diag(p),empirical=TRUE)
Id<-which(rowSums(x0*x0)<=radius**2)
cov(x0[Id,])

qalpa<-qchisq(alpha,p)
diag(1/(alpha/(pchisq(qalpa,p+2))),p)

Vì vậy, cuối cùng, để trả lời câu hỏi, quyết định của ma trận hiệp phương sai của các quan sát với chỉ tiêu Eucledian nhỏ nhất đối với gốc (đây là trường hợp cụ thể trong đó và ) được đưa ra bởi:[ α n ] Σ = Tôilog[αn]μΣ=IIpμμ=00p

(3)plogFχp+22(qα)plogα
  1. Croux C., Haesbroeck G. (1999). Hàm ảnh hưởng và hiệu quả của ước lượng ma trận phân tán xác định hiệp phương sai tối thiểu. Tạp chí phân tích đa biến. 71. 161--190.
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.