Có phân phối chung tham số sao cho

Có phân phối chung tham số sao cho và đều đồng nhất trên (tức là một copula) và là tuyến tính (theo ý tôi là affine) trong ? Đó là, trong khi và mỗi lề . $X$ $Y$ $[0, 1]$ $\mathbb{E}[Y | X = x]$ $x$

E [Y | X = x] = a + b x

$\mathbb{E}[Y \;|\; X = x] = a + b\,x$

X

$X$

Y

$Y$

Uniform [0, 1]

$\text{Uniform}[0, 1]$

Tất nhiên tôi có thể để và độc lập, trong trường hợp này . Có bất kỳ công thức tham số đơn giản nào thỏa mãn các ràng buộc của tôi mà không có hai biến độc lập không? (Một trường hợp cạnh khác sẽ là và .) $X$ $Y$ $\mathbb{E}[Y \;|\; X = x] = 0.5$ $Y=X$ $\mathbb{E}[Y \;|\; X = x] = x$

Lưu ý rằng và trong chỉ có một bậc tự do, vì . $a$ $b$ $\mathbb{E}[Y \;|\; X = x] = a + b\,x$ $\mathbb{E}[Y] = 0.5 = \mathbb{E}[\mathbb{E}[Y \; | \; X]] = a + 0.5\,b$

Một số động lực trong thế giới thực để làm cho điều này bớt trừu tượng hơn: Nghiên cứu của Chetty et al về di chuyển thu nhập giữa các thế hệ tìm thấy (gần như) các công thức thu nhập tuyến tính (nghĩa là mối quan hệ gần như tuyến tính giữa xếp hạng thu nhập của cha mẹ và xếp hạng thu nhập của con cái họ). Xem http://www.rajchetty.com/chettyfiles/mobility_trends_published.pdf (Hình 1. Xếp hạng thu nhập của trẻ so với xếp hạng thu nhập của phụ huynh theo nhóm sinh) và http://www.rajchetty.com/chettyfiles/mobility_geo.pdf (Hình II : Hiệp hội giữa Xếp hạng phần trăm của trẻ em và phụ huynh).

— Adrian
nguồn

Một mối quan hệ tầm thường (mà tôi không nghĩ rằng bạn muốn) là có

X = Y

$X=Y$ . (cảm ơn @whuber vì đã chỉ ra ví dụ trước đây của tôi không phải là copula)

— Cliff AB

Chúng ta có thể phát triển các gia đình tham số phong phú từ giải pháp tầm thường với copula $F(x,y) = \min(x,y)$ , trường hợp tương quan hoàn hảo (tích cực) và đối tác của nó cho tương quan âm hoàn hảo. Thay vào đó, việc tập trung xác suất dọc theo đoạn đường nối từ đến với cung cấp cho copula $(0,\alpha)$ $(1,\beta)$ $\beta\gt \alpha$

F (x, y; α, β) = {\begin{cases} \begin{matrix} x y, & 0 \leq y < α or β < y \leq 1 \\ β x, & x (β - α) \leq y - α \\ α x + y - α & otherwise. \end{matrix} \end{cases}

$F(x,y;\alpha,\beta) = \cases{\matrix{x y,&0\le y \lt \alpha\text{ or }\beta \lt y \le 1 \\ \beta x,&x(\beta-\alpha)\le y-\alpha \\ \alpha x + y-\alpha&\text{otherwise.}}}$

Một copula tương tự phát sinh khi , mà tôi cũng sẽ chỉ định . $\beta \lt \alpha$ $F(x,y;\alpha,\beta)$

Hãy nghĩ về những điều này như là hỗn hợp: khi , có các thành phần đồng nhất trên các hình chữ nhật nằm ngang , , và trên hình chữ nhật trung tâm có một mối tương quan hoàn hảo (phân phối của nó là cho biến được phân phối đồng đều ). Quan niệm này về giúp dễ dàng tính toán hồi quy: đó là tổng của ba phương tiện có điều kiện, $\beta \gt \alpha$ $[0,1]\times [0,\alpha]$ $[0,1]\times[\beta,1]$ $[0,1]\times[\alpha,\beta]$ $(U, \alpha+(\beta-\alpha)U)$ $U$ $F$

E (Y ∣ X) = α (\frac{α}{2}) + (β - α) (α + (β - α) X) + (1 - β) (\frac{1 + β}{2}) .

$\mathbb{E}(Y\mid X) = \alpha\left(\frac{\alpha}{2}\right) + (\beta-\alpha)\left(\alpha + (\beta-\alpha)X\right) + (1-\beta)\left(\frac{1+\beta}{2}\right).$

Điều này rõ ràng là tuyến tính trong : phần chặn bằng và độ dốc là lần dấu của . Hơn nữa, nó đã được xây dựng để có biên độ thống nhất. $X$ $(1+(\beta-\alpha)^2)/2$ $(\beta-\alpha)^2$ $\beta-\alpha$

Để tạo một họ tham số, chọn bất kỳ phân phối tham số nào cho với tham số . Đặt là hàm phân phối. Nó mô tả một hỗn hợp của thông qua tích hợp: $(\alpha,\beta)$ $\theta$ $G(\alpha,\beta;\theta)$ $F(;\alpha,\beta)$

\tilde{F} (x, y; θ) = \iint F (x, y; α, β) d G (α, β; θ)

$\tilde F(x,y;\theta) = \iint F(x,y;\alpha,\beta)dG(\alpha,\beta;\theta)$

là hàm phân phối (copula). Bởi vì mỗi có lề đồng nhất, nên . Hơn nữa, hồi quy của nó là tuyến tính vì $F(;\alpha,\beta)$ $\tilde F(;\theta)$

\begin{aligned} E_{\tilde{F} (; θ)} (Y ∣ X) & = \iint E_{F (; α, β)} (Y ∣ X) d G (α, β; θ) \\ = \iint ((1 + (β - α)^{2}) / 2 + sgn (β - α) (β - α)^{2} X) d G (α, β; θ) \\ = \iint (1 + (β - α)^{2}) / 2 d G (α, β; θ) + \iint sgn (β - α) (β - α)^{2} d G (α, β; θ) X \\ = E_{G (; θ)} ((1 + (β - α)^{2}) / 2) + E_{G (; θ)} (sgn (β - α) (β - α)^{2}) X . \end{aligned}

$\eqalign{ \mathbb{E}_{\tilde F(;\theta)}(Y\mid X) &= \iint \mathbb{E}_{F(;\alpha,\beta)}(Y\mid X)dG(\alpha,\beta;\theta)\\ &=\iint ((1+(\beta-\alpha)^2)/2 + \operatorname{sgn}(\beta-\alpha)(\beta-\alpha)^2 X)dG(\alpha,\beta;\theta) \\ &= \iint (1+(\beta-\alpha)^2)/2 dG(\alpha,\beta;\theta) + \iint \operatorname{sgn}(\beta-\alpha)(\beta-\alpha)^2 dG(\alpha,\beta;\theta)\,X\\ &= \mathbb{E}_{G(;\theta)}((1+(\beta-\alpha)^2)/2) + \mathbb{E}_{G(;\theta)}(\operatorname{sgn}(\beta-\alpha)(\beta-\alpha)^2)X. }$

Điều này cho thấy mức độ chặn và độ dốc là kỳ vọng của đánh chặn và độ dốc (đối với ), cung cấp thông tin hữu ích để chọn gia đình phù hợp . $G$ $G(;\theta)$

Những tài liệu đồ họa mô phỏng từ một gia đình như vậy. Ở đây, được rút ra từ bản phân phối Beta và được rút ra độc lập với bản phân phối Beta . Cột đầu tiên hiển thị biểu đồ của việc thực hiện các tham số này. Cột thứ hai hiển thị biểu đồ phân phối biên của và : chúng gần giống với thống nhất. Cột ngoài cùng bên phải hiển thị một tập hợp con ngẫu nhiên của 100.000 giá trị mô phỏng, cùng với ước tính hồi quy của nó (đường màu đỏ) và gần đúng với hồi quy lý thuyết (đường chấm đen): chúng đồng ý chặt chẽ. Hồi quy ước tính thu được bằng cách tính các phương tiện của $\alpha$ $(5,1)$ $\beta$ $(3,10)$ $X$ $Y$ $X$ và trong các cửa sổ của , sau đó làm mịn dấu vết của chúng bằng Loess. $Y$ $X$

(Đường hồi quy "lý thuyết" chỉ là một xấp xỉ thu được bằng cách thay thế và trong các công thức kỳ vọng bằng các kỳ vọng của chúng. Các công thức chính xác rất đơn giản để thực hiện trong trường hợp này, nhưng mã dài và lộn xộn.) $\alpha$ $\beta$

Các Rmã mà tạo ra con số này có thể dễ dàng được sử dụng để nghiên cứu các gia đình khác . $G(;\theta)$

#
# Draw `n` variates from the mixture copula.
# `alpha` and `beta` are intended to be realizations of G(;theta).
#
runif.xy <- function(n, alpha=0, beta=1) {
  a <- pmin(alpha, beta)
  b <- pmax(alpha, beta)
  xy <- matrix(runif(2*n), nrow=2)              # Start with a uniform distribution
  i <- xy[2,] > a & xy[2,] < b                  # Select the middle rectangle
  xy[2, i] <- (xy[1,]*(beta - alpha) + alpha)[i]# Create perfect correlation
  return(xy)
}
#
# Specify the parameters ("theta").
#
a.alpha <- 5
b.alpha <- 1
a.beta <- 3
b.beta <- 10
#
# Draw the slope `beta` and intercept `alpha` from G(;theta).
#
n.sim <- 1e5
alpha <- rbeta(n.sim, a.alpha, b.alpha)
beta <- rbeta(n.sim, a.beta, b.beta)
#
# Draw (X,Y) from the mixture.
#
sim <- runif.xy(n.sim, alpha, beta)
#
# Plot histograms of alpha, beta, X, Y.
#
par(mfcol=c(2,3))
hist(alpha); abline(v=a.alpha/(a.alpha+b.alpha), col="Red", lwd=2)
hist(beta); abline(v=a.beta/(a.beta+b.beta), col="Red", lwd=2)
hist(sim[1,], main="X Marginal", xlab="X")
hist(sim[2,], main="Y Marginal", xlab="Y")
#
# Plot the simulation and its regression curve.
#
i <- sample.int(n.sim, min(5e3, n.sim)) # Limit how many points are shown
plot(t(sim[, i]), asp=1, pch=19, col="#00000002", main="Simulation",
     xlab="X", ylab="Y")

library(zoo)
i <- order(sim[1,])
x <- as.vector(rollapply(ts(sim[1, i]), ceiling(n.sim/100), mean))
y <- as.vector(rollapply(ts(sim[2, i]), ceiling(n.sim/100), mean))
lines(lowess(y ~ x), col="Red", lwd=2)
#
# Overplot the theoretical regression curve.
#
a <- a.alpha / (a.alpha + b.alpha) # Expectation of `alpha`
b <- a.beta / (a.beta + b.beta)    # Expectation of `beta`
intercept <- (1 + (b-a)^2)/2
slope <- (b - a)^2 * sign(b-a)
abline(c(intercept, slope), lty=3, lwd=3)

— whuber
nguồn