Giới hạn phân phối


8

Đặt là một chuỗi các biến ngẫu nhiên iid . Xác định và cho . Tìm phân phối giới hạn của(Xn)N(0,1)S0= =0Sn= =Σk= =1nXkn1

1nΣk= =1n|Sk-1|(Xk2-1)

Vấn đề này là từ một cuốn sách vấn đề về Lý thuyết xác suất, trong chương về Định lý giới hạn trung tâm.

Vì và là độc lập, vàSk-1XkE(|Sk-1|(Xk2-1))= =0

V(|Sk-1|(Xk2-1))= =E(Sk-12(Xk2-1)2)= =E(Sk-12)E(Xk2-1)2)= =2(k-1)

Lưu ý rằng rõ ràng không độc lập. Vấn đề là từ các vấn đề về Xác suất của Shiryaev , chính nó dựa trên sách giáo khoa từ cùng một tác giả. Sách giáo khoa dường như không bao gồm CLT cho các biến tương quan. Tôi không biết nếu có một chuỗi, pha trộn ẩn ở đâu đó ...|Sk-1|(Xk2-1)

Tôi đã chạy mô phỏng để cảm nhận câu trả lời

import numpy as np
import scipy as sc
import scipy.stats as stats
import matplotlib.pyplot as plt

n = 20000 #summation index
m = 2000 #number of samples

X = np.random.normal(size=(m,n))
sums = np.cumsum(X, axis=1)
sums = np.delete(sums, -1, 1)
prods = np.delete(X**2-1, 0, 1)*np.abs(sums)
samples = 1/n*np.sum(prods, axis=1)

plt.hist(samples, bins=100, density=True)
x = np.linspace(-6, 6, 100)
plt.plot(x, stats.norm.pdf(x, 0, 1/np.sqrt(2*np.pi)))
plt.show()

Dưới đây là biểu đồ gồm mẫu ( ). Nó trông khá bình thường được phân phối ...2000n= =20.000

nhập mô tả hình ảnh ở đây


@MartijnWeterings Tôi đã đăng bài này vì tôi đã suy nghĩ vấn đề một thời gian và tôi bị mắc kẹt. Nó có lẽ là xa tầm thường ...
Gabriel Romon

@MartijnWeterings , do đóV ( | S k - 1 | ( X 2 k - 1 ) ) = E ( S 2 k - 1 ( X 2 k - 1 ) 2 )E(|Sk-1|(Xk2-1))= =0V(|Sk-1|(Xk2-1))= =E(Sk-12(Xk2-1)2)
Gabriel Romon

@MartijnWeterings Vâng, tôi đã bỏ qua sự bình đẳng tầm thường cho ... x R|x|2= =x2xR
Gabriel Romon

Biểu đồ trong mô phỏng là một kết hợp khủng khiếp cho phân phối Bình thường. Nếu bạn không bị thuyết phục, hãy tính kurtosis.
whuber

@MartijnWeterings Vâng, tôi đã thực hiện một thiếu sót ngượng ngùng trong mã. Tôi đã cập nhật nó, cũng như biểu đồ, trông giống như bình thường. Bạn có một ý tưởng về giá trị chính xác của phương sai?
Gabriel Romon

Câu trả lời:


1

Khi tôi mô phỏng phân phối thì tôi nhận được một cái gì đó giống với phân phối Laplace. Thậm chí tốt hơn có vẻ là một q-Gausian (các tham số chính xác bạn sẽ phải tìm bằng lý thuyết).

Tôi đoán rằng cuốn sách của bạn phải chứa một số biến thể của CLT liên quan đến điều đó (định lý giới hạn trung tâm tổng quát q, có lẽ nó nằm trong Phần 7.6 Định lý giới hạn trung tâm cho tổng các biến phụ thuộc , nhưng tôi không thể tra cứu nó khi tôi không có sẵn sách).

mô phỏng

library(qGaussian)
set.seed(1)
Qstore <- c(0) # vector to store result

n <- 10^6  # columns X_i
m <- 10^2  # rows repetitions

pb <- txtProgressBar(title = "progress bar", min = 0,
                     max = 100, style=3)
for (i in 1:100) {  
  # doing this several times because this matrix method takes a lot of memory
  # with smaller numbers n*m it can be done at once

  X <- matrix(rnorm(n*m,0,1),m)
  S <- t(sapply(1:m, FUN = function(x) cumsum(X[x,])))
  S <- cbind(rep(0,m),S[,-n])
  R <- abs(S)*(X^2-1)
  Q <- t(sapply(1:m, FUN = function(x) cumsum(R[x,])))

  Qstore <- c(Qstore,t(Q[,n]))
  setTxtProgressBar(pb, i)
}
close(pb)

# compute histogram 
x <- seq(floor(min(Qstore/n)), ceiling(max(Qstore/n)), 0.2)
h <- hist(Qstore/(n),breaks = x)

# plot simulation
plot( h$mid, h$density, log = "y", xlim=c(-7,7),
      ylab = "log density" , xlab = expression(over(1,n)*sum(abs(S[k-1])*(X[k]^2-1),k==1,n) ) )

# distributions for comparison
lines(x, dnorm(x,0,1),                   col=1, lty=3)      #normal 
lines(x, dexp(abs(x),sqrt(2))/2,         col=1, lty=2)      #laplace
lines(x, qGaussian::dqgauss(x,sqrt(2),0,1/sqrt(2)), col=1, lty=1)      #qgauss

# further plotting
title("10^4 repetitions with n=10^6")
legend(-7,0.6,c("Gaussian", "Laplace", "Q-Gaussian"),col=1, lty=c(3,2,1),cex=0.8)

Về nội dung của sách giáo khoa, tốt nhất bạn nên tự mình xem: Tập 1 , Tập 2 . Vấn đề chỉ nên yêu cầu tài liệu được đề cập trong Chương 3.4
Gabriel Romon

@GabrielRomon cảm ơn bạn rất nhiều vì những liên kết đó. Nhìn vào nó, từ điện thoại của tôi, tôi không thể tìm thấy bất cứ điều gì về q-Gaussian hoặc các bản phân phối giới hạn khác không phải là bản phân phối bình thường. Vì vậy, bản phân phối có tốc độ hội tụ rất chậm n >> 10 ^ 6 trước khi chúng ta nhìn thấy nó, hoặc câu hỏi không phù hợp với chương (có phải từ cuốn sách, tôi không thể tìm thấy câu hỏi?). Một âm mưu của các khoảnh khắc bậc cao hơn (như hàm của n) có thể hiển thị tốt hơn cho dù chuyển đổi có thể vẫn xảy ra hay không, nhưng tôi đoán rằng đây không phải là trường hợp CLT điển hình.
Sextus Empiricus

1
Đây là vấn đề 3,4,14 trong cuốn sách vấn đề .
Gabriel Romon
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.