Trực giác đằng sau các phân phối Gaussian có điều kiện là gì?


46

Giả sử rằng . Sau đó, phân phối có điều kiện của cho rằng là đa biến thường được phân phối với giá trị trung bình:XN2(μ,Σ)X1X2=x2

E[P(X1|X2=x2)]=μ1+σ12σ22(x2μ2)

và phương sai:

Var[P(X1|X2=x2)]=σ11σ122σ22

Nó có ý nghĩa rằng phương sai sẽ giảm vì chúng ta có nhiều thông tin hơn. Nhưng trực giác đằng sau công thức trung bình là gì? Làm thế nào để hiệp phương sai giữa và có nghĩa là có điều kiện?X1X2


2
Có phải câu hỏi của bạn chỉ đơn giản là 'tại sao không phải là trung bình của phân phối có điều kiện = '? μ1
gung - Phục hồi Monica

@gung: Điều này đúng nếu . Nhưng tại sao và có liên quan? x2=μ2σ11σ22
eroeijr

3
Trong các đơn vị tự nhiên ("tiêu chuẩn hóa"), chúng tôi viết trong đó . Trong các điều khoản này, phân phối có điều kiện là Bình thường với vàThực tế là được gọi là "đảo ngược trung bình" hoặc "hồi quy trung bình" : có một tài liệu kỹ thuật và phổ biến rộng rãi về điều này cách đây 130 năm. Xi=μ1+σiZiσi=σiiE(Z1|Z2)=ρZ2ρ=σ12/(σ1σ2).|ρ|1
whuber

2
Nói, eroeijr, bài này là của bạn? (Ngoài 'khách' khi bắt đầu, có một sự tương đồng rõ rệt trong tên.) Nếu đó là của bạn, bạn nên yêu cầu hợp nhất hai tài khoản và nhận phần thưởng lớn trong số điểm bạn có.
Glen_b

2
Như @Glen_b đã đề xuất, nếu bạn có nhiều tài khoản (chưa đăng ký), vui lòng điền vào biểu mẫu tại stats.stackexchange.com/contact và yêu cầu chúng được hợp nhất.
chl

Câu trả lời:


57

Tóm tắc

Mỗi câu trong câu hỏi có thể được hiểu là một thuộc tính của dấu chấm lửng. Các chỉ bất động sản đặc biệt đến sự phân bố bình thường hai biến đó là cần thiết là một thực tế rằng trong một tiêu chuẩn hai biến phân phối bình thường của --cho đó và là không tương quan - phương sai có điều kiện của không phụ thuộc vào . (Điều này đến lượt nó là một hậu quả ngay lập tức của thực tế là thiếu sự tương quan hàm ý sự độc lập cho các biến Bình thường chung.)X Y Y XX,YXYYX

Phân tích sau đây cho thấy chính xác tính chất nào của dấu chấm lửng có liên quan và rút ra tất cả các phương trình của câu hỏi bằng cách sử dụng các ý tưởng cơ bản và số học đơn giản nhất có thể, theo cách dễ dàng ghi nhớ.


Phân phối đối xứng tròn

Phân phối của câu hỏi là một thành viên của gia đình phân phối chuẩn bivariate. Tất cả chúng đều có nguồn gốc từ một thành viên cơ bản, chuẩn bivariate Standard , mô tả hai phân phối chuẩn tiêu chuẩn không tương thích (tạo thành hai tọa độ của nó).

Hình 1: phân phối chuẩn bivariate tiêu chuẩn

Phía bên trái là một biểu đồ cứu trợ của mật độ chuẩn bivariate tiêu chuẩn. Phía bên phải hiển thị tương tự trong giả 3D, với phần phía trước được cắt đi.

Đây là một ví dụ về phân bố đối xứng tròn : mật độ thay đổi theo khoảng cách từ một điểm trung tâm nhưng không theo hướng từ điểm đó. Do đó, các đường viền của đồ thị của nó (ở bên phải) là các vòng tròn.

Tuy nhiên, hầu hết các phân phối chuẩn khác thường không đối xứng tròn: mặt cắt ngang của chúng là các hình elip. Những hình elip này mô hình hình dạng đặc trưng của nhiều đám mây điểm bivariate.

Hình 2: một phân phối chuẩn bivariate khác, được vẽ

Đây là chân dung của phân phối chuẩn bivariate với ma trận hiệp phương sai Đó là một mô hình cho dữ liệu với hệ số tương quan .-2/3Σ=(123231).2/3


Cách tạo Ellipses

Một hình elip - theo định nghĩa lâu đời nhất của nó - là một phần hình nón, là một hình tròn bị biến dạng bởi hình chiếu lên một mặt phẳng khác. Bằng cách xem xét bản chất của phép chiếu, giống như các nghệ sĩ thị giác làm, chúng ta có thể phân tách nó thành một chuỗi các biến dạng dễ hiểu và dễ tính toán.

Đầu tiên, kéo dài (hoặc, nếu cần, bóp) vòng tròn dọc theo cái sẽ trở thành trục dài của hình elip cho đến khi nó có độ dài chính xác:

Bước 1: kéo dài

Tiếp theo, ép (hoặc kéo dài) hình elip này dọc theo trục nhỏ của nó:

Bước 2: bóp

Thứ ba, xoay nó quanh tâm của nó thành hướng cuối cùng của nó:

Bước 3: xoay

Cuối cùng, chuyển nó đến vị trí mong muốn:

Bước 4: thay đổi

Đây là tất cả các biến đổi affine. (Trong thực tế, ba biến đổi đầu tiên là các phép biến đổi tuyến tính ; sự dịch chuyển cuối cùng làm cho nó có liên quan.) Bởi vì một thành phần của các phép biến đổi affine vẫn (theo định nghĩa) vẫn còn affine, biến dạng ròng từ vòng tròn đến hình elip cuối cùng là một phép biến đổi affine. Nhưng nó có thể hơi phức tạp:

Biến đổi tổng hợp

Lưu ý những gì đã xảy ra với các trục (tự nhiên) của hình elip: sau khi chúng được tạo ra bởi sự dịch chuyển và ép, chúng (tất nhiên) đã xoay và dịch chuyển cùng với chính trục đó. Chúng ta dễ dàng nhìn thấy các trục này ngay cả khi chúng không được vẽ, bởi vì chúng là các trục đối xứng của chính hình elip.

Chúng tôi muốn áp dụng sự hiểu biết của chúng tôi về các hình elip để hiểu các phân phối đối xứng hình tròn bị biến dạng, giống như gia đình Bình thường bivariate. Thật không may, có một vấn đề với những biến dạng này : chúng không tôn trọng sự phân biệt giữa trục và . Vòng quay ở bước 3 hủy hoại mà. Nhìn vào các lưới tọa độ mờ trong nền: chúng hiển thị những gì xảy ra với lưới (của lướiy 1 / 2 xxy1/2theo cả hai hướng) khi nó bị biến dạng. Trong hình ảnh đầu tiên, khoảng cách giữa các đường thẳng đứng ban đầu (hiển thị rắn) được nhân đôi. Trong hình ảnh thứ hai, khoảng cách giữa các đường ngang ban đầu (hiển thị nét đứt) được thu hẹp bằng một phần ba. Trong hình ảnh thứ ba, các khoảng cách lưới không được thay đổi, nhưng tất cả các dòng được xoay. Họ dịch chuyển lên và sang phải trong hình ảnh thứ tư. Hình ảnh cuối cùng, hiển thị kết quả thực, hiển thị lưới kéo dài, vắt, xoay, dịch chuyển này. Các đường liền nét ban đầu của tọa độ không đổi không còn là chiều dọc.x

Ý tưởng then chốt --one có thể mạo hiểm để nói nó là các điểm then chốt của hồi quy - là có một cách thức mà các vòng tròn có thể bị bóp méo thành một hình elip mà không xoay đường dọc . Bởi vì vòng quay là thủ phạm, chúng ta hãy cắt theo đuổi và chỉ ra cách tạo ra một hình elip xoay mà không thực sự xuất hiện để xoay bất cứ thứ gì !

Hình elip xiên

Đây là một biến đổi lệch. Nó thực sự làm hai việc cùng một lúc:

  • Nó ép theo hướng (bằng một lượng , nói). Điều này để lại -axis một mình.λ xyλx

  • Nó nâng bất kỳ điểm kết quả bằng một tỷ lệ trực tiếp với . Viết hằng số tỷ lệ đó là , điều này sẽ gửi đến .x ρ ( x , y ) ( x , y + ρ x )(x,y)xρ(x,y)(x,y+ρx)

Bước thứ hai nâng -axis vào dòng , được hiển thị trong hình trước. Như thể hiện trong hình đó, tôi muốn làm việc với một phép biến đổi nghiêng đặc biệt, một phép xoay hình elip 45 độ một cách hiệu quả và ghi nó vào hình vuông đơn vị. Trục chính của hình elip này là đường . Rõ ràng là rõ ràng rằng . (Giá trị âm của nghiêng hình elip xuống bên phải thay vì lên bên phải.) Đây là giải thích hình học của "hồi quy trung bình".y = ρ x y = x | ρ | 1 ρxy=ρxy=x|ρ|1ρ

Chọn một góc 45 độ làm cho hình elip đối xứng quanh đường chéo của hình vuông (một phần của đường ). Để tìm ra các tham số của phép biến đổi nghiêng này, hãy quan sát:y=x

  • Việc nâng bằng di chuyển điểm đến .( 1 , 0 ) ( 1 , ρ )ρx(1,0)(1,ρ)

  • Đối xứng xung quanh đường chéo chính sau đó ngụ ý điểm cũng nằm trên hình elip.(ρ,1)

Điểm này bắt đầu từ đâu?

  • Điểm ban đầu (phía trên) trên vòng tròn đơn vị (có phương trình ngầm định ) với tọa độ là .x2+y2=1xρ(ρ,1ρ2)

  • Bất kỳ điểm nào của biểu mẫu trước tiên được ép thành và sau đó được nâng lên .(ρ,y)(ρ,λy)(ρ,λy+ρ×ρ)

Giải pháp duy nhất cho phương trình là . Đó là số lượng mà tất cả các khoảng cách theo hướng dọc phải được nén để tạo hình elip ở góc 45 độ khi nó bị lệch theo chiều dọc của .(ρ,λ1ρ2+ρ2)=(ρ,1)λ=1ρ2ρ

Để củng cố những ý tưởng này, đây là một hoạt cảnh cho thấy cách phân phối đối xứng tròn bị biến dạng thành các phân phối với các đường viền hình elip bằng các phép biến đổi nghiêng này. Các bảng hiển thị các giá trị của bằng và từ trái sang phải.ρ0, 3/10, 6/10,9/10,

Tableau

Hình ngoài cùng bên trái cho thấy một tập hợp các điểm bắt đầu xung quanh một trong các đường viền tròn cũng như một phần của trục ngang. Các số liệu tiếp theo sử dụng các mũi tên để chỉ ra cách các điểm đó được di chuyển. Hình ảnh của trục ngang xuất hiện dưới dạng một đoạn đường xiên (có độ dốc ). (Các màu đại diện cho các lượng mật độ khác nhau trong các hình khác nhau.)ρ


Ứng dụng

Chúng tôi đã sẵn sàng để làm hồi quy. Một phương pháp chuẩn, thanh lịch (nhưng đơn giản) để thực hiện hồi quy trước tiên là biểu thị các biến ban đầu trong các đơn vị đo lường mới: chúng tôi tập trung chúng vào phương tiện của chúng và sử dụng độ lệch chuẩn của chúng làm đơn vị. Điều này di chuyển trung tâm của phân phối đến gốc và làm cho tất cả các đường viền hình elip của nó nghiêng 45 độ (lên hoặc xuống).

Khi các dữ liệu được tiêu chuẩn hóa này tạo thành một đám mây điểm tròn, hồi quy rất dễ dàng: phương tiện có điều kiện trên đều bằng , tạo thành một dòng đi qua gốc. (Đối xứng tròn ngụ ý đối xứng với trục , cho thấy rằng tất cả các phân phối có điều kiện là đối xứng, vì chúng có phương tiện. , tất cả các giá trị (được chuẩn hóa) được nhân với cho một số giá trị của ; tiếp theo, tất cả các giá trị với tọa độ được xiên theo chiều dọc bởix0x0y1ρ2ρxρx. Những biến dạng này đã làm gì đối với đường hồi quy (vẽ đồ thị có nghĩa là có điều kiện chống lại )?x

  • Việc thu hẹp tọa độ nhân tất cả các độ lệch dọc bằng một hằng số. Điều này chỉ thay đổi tỷ lệ dọc và để lại tất cả các phương tiện có điều kiện không thay đổi ở .y0

  • Phép biến đổi xiên dọc đã thêm vào tất cả các giá trị có điều kiện tại , do đó thêm vào trung bình điều kiện của chúng: đường cong là đường hồi quy, hóa ra là một đường.ρxxρxy=ρx

Tương tự, chúng tôi có thể xác minh rằng vì -axis là bình phương nhỏ nhất phù hợp với phân bố đối xứng tròn, nên bình phương nhỏ nhất phù hợp với phân phối đã chuyển đổi cũng là đường : đường bình phương nhỏ nhất trùng với đường hồi quy .xy=ρx

Những kết quả đẹp này là kết quả của thực tế là phép biến đổi xiên dọc không thay đổi bất kỳ tọa độ nào .x

Chúng ta có thể dễ dàng nói nhiều hơn:

  • Viên đạn đầu tiên (về thu hẹp) cho thấy rằng khi có bất kỳ phân phối đối xứng tròn nào , phương sai điều kiện của được nhân với .(X,Y)Y|X(1ρ2)2=1ρ2

  • Tổng quát hơn: phép biến đổi xiên dọc sẽ hủy bỏ mỗi phân phối có điều kiện theo và sau đó gần đây nó bằng .1ρ2ρx

Đối với phân phối chuẩn bivariate chuẩn, phương sai điều kiện là một hằng số (bằng ), không phụ thuộc vào . Chúng tôi ngay lập tức kết luận rằng sau khi áp dụng phép biến đổi nghiêng này, phương sai có điều kiện của độ lệch dọc vẫn là một hằng số và bằng . Bởi vì các bản phân phối có điều kiện của Bình thường bivariate là Bình thường, bây giờ chúng tôi biết phương tiện và phương sai của chúng, chúng tôi có thông tin đầy đủ về chúng.1x1ρ2

Cuối cùng, chúng ta cần liên hệ với ma trận hiệp phương sai ban đầu . ρΣ Đối với điều này, hãy nhớ rằng định nghĩa (đẹp nhất) của hệ số tương quan giữa hai biến và được tiêu chuẩn hóa là kỳ vọng của sản phẩm của chúng . (Tương quan của và được khai báo đơn giản là tương quan của các phiên bản được tiêu chuẩn hóa của chúng.) Do đó, khi tuân theo bất kỳ phân phối đối xứng tròn nào và chúng tôi áp dụng phép biến đổi nghiêng cho các biến, chúng tôi có thể viếtXYXYXY(X,Y)

ε=YρX

đối với độ lệch dọc từ đường hồi quy và lưu ý rằng phải có phân phối đối xứng quanh . Tại sao? Bởi vì trước khi việc chuyển đổi nghiêng đã được áp dụng, đã có một phân phối đối xứng xung quanh và sau đó chúng tôi (a) vắt nó và (b) dỡ bỏ nó bằng . Cái trước không thay đổi tính đối xứng của nó trong khi cái sau lấy lại nó tại , QED. Hình tiếp theo minh họa điều này.ε0Y0ρXρX

Biểu đồ 3D hiển thị các bản phân phối có điều kiện và dòng bình phương nhỏ nhất

Các đường màu đen vạch ra độ cao tỷ lệ thuận với mật độ có điều kiện ở các giá trị cách đều đặn khác nhau của . Đường trắng dày là đường hồi quy, đi qua tâm đối xứng của mỗi đường cong có điều kiện. Biểu đồ này hiển thị trường hợp trong tọa độ chuẩn.xρ=1/2

hậu quả là

E(XY)=E(X(ρX+ε))=ρE(X2)+E(Xε)=ρ(1)+0=ρ.

Sự bình đẳng cuối cùng là do hai sự thật: (1) vì đã được chuẩn hóa, kỳ vọng của hình vuông của nó là phương sai chuẩn hóa của nó, bằng khi xây dựng; và (2) kỳ vọng của bằng với kỳ vọng của nhờ vào tính đối xứng của . Bởi vì cái sau là âm của cái trước, cả hai phải bằng : thuật ngữ này bỏ đi.X1XεX(ε)ε0

Chúng tôi đã xác định được các thông số của sự biến đổi nghiêng, , như là hệ số tương quan của và .ρXY


Kết luận

Bằng cách quan sát rằng bất kỳ hình elip nào cũng có thể được tạo ra bằng cách làm biến dạng một vòng tròn với phép biến đổi xiên dọc giữ nguyên tọa độ , chúng ta đã hiểu được các đường viền của bất kỳ phân phối biến ngẫu nhiên nào có được từ một đối xứng tròn một bằng các phương tiện kéo dài, ép, xoay và dịch chuyển (nghĩa là, bất kỳ chuyển đổi affine nào). Bằng cách biểu thị lại kết quả theo đơn vị ban đầu của và - số tiền để thêm lại phương tiện của họ, và , sau khi nhân với độ lệch chuẩn của họ và - chúng tôi thấy rằng:x(X,Y)xyμxμyσxσy

  • Cả đường bình phương nhỏ nhất và đường hồi quy đều đi qua gốc của các biến được tiêu chuẩn hóa, tương ứng với "điểm trung bình" trong tọa độ ban đầu.(μx,μy)

  • Đường cong hồi quy, được xác định là quỹ tích của các phương tiện có điều kiện, trùng với đường bình phương nhỏ nhất.{(x,ρx)},

  • Độ dốc của đường hồi quy trong tọa độ chuẩn là hệ số tương quan ; do đó, trong các đơn vị ban đầu, nó bằng với .ρσyρ/σx

Do đó phương trình của đường hồi quy là

y=σyρσx(xμx)+μy.
  • Phương sai điều kiện của là với phương sai điều kiện của trong đó có phân phối chuẩn (đối xứng tròn với phương sai đơn vị ở cả hai tọa độ), và .Y|Xσy2(1ρ2)Y|X(X,Y)X=(XμX)/σxY=(YμY)/σY

Không có kết quả nào trong số này là một thuộc tính cụ thể của các bản phân phối chuẩn bivariate! Đối với gia đình Bình thường bivariate, phương sai có điều kiện của là hằng số (và bằng ): thực tế này làm cho gia đình đó đặc biệt đơn giản để làm việc. Đặc biệt:Y|X1

  • Bởi vì trong ma trận hiệp phương sai các hệ số là và phương sai có điều kiện của cho phân phối chuẩn bivariate làΣσ11=σx2, σ12=σ21=ρσxσy,σ22=σy2,Y|X

σy2(1ρ2)=σ22(1(σ12σ11σ22)2)=σ22σ122σ11.

Ghi chú kỹ thuật

Ý tưởng chính có thể được nêu trong các điều khoản của ma trận mô tả các phép biến đổi tuyến tính. Nó đi xuống để tìm một "căn bậc hai" phù hợp của ma trận tương quan mà là một hàm riêng. Do vậy:y

(1ρρ1)=AA

Ở đâu

A=(10ρ1ρ2).

Một căn bậc hai được biết đến nhiều hơn là một căn nguyên được mô tả ban đầu (liên quan đến một phép quay thay vì một phép biến đổi nghiêng); nó là cái được tạo ra bởi sự phân rã giá trị số ít và nó đóng một vai trò nổi bật trong phân tích thành phần chính (PCA):

(1ρρ1)=BB;

B=Q(ρ+1001ρ)Q

trong đó là ma trận xoay cho xoay độ.Q=(12121212)45

Do đó, sự khác biệt giữa PCA và hồi quy bắt nguồn từ sự khác biệt giữa hai căn bậc hai đặc biệt của ma trận tương quan.


1
Hình ảnh đẹp và mô tả tuyệt vời. Có một vài câu trong bản cập nhật chưa hoàn chỉnh (như bạn đã biết về cơ bản những gì bạn sẽ nói, nhưng đã không giải quyết được từ ngữ cuối cùng).
hồng y

1
@ Cardinal Cảm ơn. Tôi sẽ đọc lại điều này và tìm kiếm những thứ như vậy, cũng như các lỗi chính tả không thể tránh khỏi. Bạn quá tử tế khi chỉ ra những điều khác mà bạn chắc chắn nhận thấy, chẳng hạn như một số lỗ hổng trong giải trình bày. Lớn nhất là tôi đã không thực sự chỉ ra rằng các hình elip này nằm ở góc 45 độ (tương đương, được ghi trong hình vuông đơn vị); Tôi chỉ đơn giản cho rằng. Tôi vẫn đang tìm kiếm một cuộc biểu tình đơn giản. Một điều nữa là người ta có thể lo lắng việc chuyển đổi xiên có thể tạo ra một phân phối khác so với dịch chuyển-ép-xoay-xoay ban đầu - nhưng thật dễ dàng để chứng minh điều đó không xảy ra.
whuber

3
Điều đó thực sự thú vị. Cảm ơn đã dành thời gian để viết nó lên.
Hóa đơn

Trong đoạn đầu của ứng dụng có viết: "chúng tôi tập trung chúng theo phương tiện của chúng và sử dụng độ lệch chuẩn của chúng làm đơn vị. Điều này di chuyển trung tâm phân phối đến gốc và làm cho tất cả các đường viền hình elip nghiêng 45 độ", nhưng tôi không ' Bạn có hiểu làm thế nào việc căn giữa các biến tại phương tiện của chúng di chuyển trung tâm của chúng về nguồn gốc và căn chỉnh chúng đến 45 độ không?
Kaushal28

@whuber khi bạn bắt đầu với vòng tròn đơn vị (bộ mẫu được chuẩn hóa), bạn nói tương quan là 0, vì vậy tôi tưởng tượng, chúng ta có một vòng tròn giống như . Nhưng làm thế nào 0 tương quan có nghĩa là độc lập? (bởi vì thu được bởi như chúng ta thấy. Nó thường không đúng phải không? Ngay cả các biến phụ thuộc có thể tạo ra tương quan 0?f(X,Y)=e12(x2+y2)f(X,Y)f(X)f(Y)
Parthiban Rajendran

21

Đây thực chất là hồi quy tuyến tính (OLS). Trong trường hợp đó, bạn đang tìm phân phối có điều kiện của với . (Nói đúng ra, hồi quy OLS không đưa ra các giả định về phân phối , trong khi ví dụ của bạn là đa biến thông thường, nhưng chúng ta sẽ bỏ qua những điều này.) Bây giờ, nếu hiệp phương sai giữa và không phải là , thì giá trị trung bình của phân phối có điều kiện của phải thay đổi khi bạn thay đổi giá trị của nơi bạn đang 'cắt qua' phân phối đa biến. Hãy xem xét hình dưới đây: YX=xiXX1X20X2x1

nhập mô tả hình ảnh ở đây

Ở đây chúng ta thấy rằng các phân phối biên đều bình thường, với mối tương quan dương giữa và . Nếu bạn xem phân phối có điều kiện của tại bất kỳ điểm nào trên , thì phân phối là một thông thường đơn biến. Tuy nhiên, do mối tương quan dương (nghĩa là hiệp phương sai khác không), giá trị trung bình của các phân phối có điều kiện sẽ dịch chuyển khi bạn di chuyển từ trái sang phải. Ví dụ: hình vẽ cho thấy . X1X2X2X1μX2|X1=25μX2|X1=45

( Đối với bất kỳ độc giả nào trong tương lai có thể bị nhầm lẫn bởi các ký hiệu, tôi muốn nói rằng, ví dụ: là một yếu tố của ma trận hiệp phương sai . Vì vậy, đó là phương sai của , mặc dù mọi người sẽ điển hình nghĩ về một phương sai là và là độ lệch chuẩn.σ22ΣX2σ2σ )

Phương trình của bạn cho giá trị trung bình được kết nối trực tiếp với phương trình ước tính độ dốc trong hồi quy OLS (và hãy nhớ rằng trong hồi quy là giá trị trung bình có điều kiện): Trong phương trình của bạn, là hiệp phương sai trên phương sai; đó là độ dốc , giống như trên. Do đó, phương trình của bạn cho giá trị trung bình chỉ là trượt trung bình có điều kiện của bạn, , tăng hoặc giảm so với trung bình vô điều kiện của nó, , dựa trên khoảng cách từ là độ dốc của mối quan hệ giữa và . y^i

β^1=Cov(x,y)Var(x)
σ12/σ22μX2|X1=xiμX2μX2 x2iX1X2

Điều gì xảy ra nếu bạn có điều kiện trên nhiều biến? Bạn sẽ chỉ cần thêm và trừ các điều khoản phụ từ trung bình và phương sai?

2
@kerkejnrke, nếu bạn mô hình phân phối điều kiện theo một số mức cụ thể của một tập hợp các biến , thì bạn đang thực hiện nhiều hồi quy . Điều này phức tạp hơn một chút, nhưng cuối cùng là điều tương tự. Giá trị trung bình sẽ là: , trong đó . YXy^i=Xiβ^β^=(XTX)1XTY
gung - Phục hồi Monica

Bạn đã sử dụng gì để sản xuất đồ thị? Toán học?
mpiktas

@mpiktas, đồ thị của tôi hay của ai? Tôi tin rằng anh ấy là Mathicala, nhưng tôi đã tạo ra một cái ở trên w / R. (Mã xấu xí ...)
gung - Tái lập Monica

1
@mpiktas, tôi không thể tưởng tượng được mã của mình sẽ được mô tả là "tuyệt vời" ... Các đường cong thông thường được vẽ w / dnorm(y). Tôi chỉ cần thêm đầu ra vào 25& 45, và sử dụng như x.
gung - Phục hồi Monica

3

Câu trả lời của Gung là tốt (+1). Có một cách khác để nhìn vào nó, mặc dù. Hãy tưởng tượng rằng hiệp phương sai giữa và là dương. Nó có nghĩa gì với ? Chà, điều đó có nghĩa là khi cao hơn mức trung bình của , có xu hướng cao hơn mức trung bình của và ngược lại .X1X2σ1,2>0X2X2X1X1

Bây giờ, giả sử tôi đã nói với bạn rằng . Đó là, giả sử tôi đã nói với bạn rằng vượt quá ý nghĩa của nó. Bạn sẽ không kết luận rằng có khả năng cao hơn mức trung bình của nó (vì bạn biết và bạn biết hiệp phương sai nghĩa là gì)? Vì vậy, bây giờ, nếu bạn lấy trung bình của , biết rằng cao hơn trung bình của , bạn sẽ nhận được một số trên trung bình của . Đó là những gì công thức nói: Nếu hiệp phương sai dương vàX2=x2>μ2X2X1σ1,2>0X1X2X2X1

E{X1|X2=x2}=μ1+σ1,2σ2,2(x2μ2)
X2là trên mức trung bình của nó, sau đó . E{X1|X2=x2}>μ1

Kỳ vọng có điều kiện có dạng trên cho phân phối bình thường, không phải cho tất cả các phân phối. Điều này có vẻ hơi lạ khi cho rằng lý do trong đoạn văn trên có vẻ khá hấp dẫn. Tuy nhiên, (hầu như) bất kể phân phối của và công thức này là đúng: Trong đó có nghĩa là bộ dự báo tuyến tính tốt nhất. Phân phối bình thường là đặc biệt trong đó kỳ vọng có điều kiện và dự đoán tuyến tính tốt nhất là điều tương tự.X1X2

BLP{X1|X2=x2}=μ1+σ1,2σ2,2(x2μ2)
BLP

Dường như không có bất kỳ yếu tố nào của đối số này thực sự cho thấy hệ số của phải bằng tỷ lệ của hiệp phương sai . Tại sao không phải là khối lập phương của tỷ lệ đó? Hay là sin của nó? Hoặc một số biện pháp liên kết khác, chẳng hạn như phân kỳ KL (ít liên quan đến hiệp phương sai)? Các công thức như vậy sẽ tái tạo một cách định tính hành vi mà bạn mô tả. Với sự mơ hồ như vậy trong lý luận, không có gì ngạc nhiên khi công thức của bạn chỉ áp dụng cho một hình thức phân phối bivariate cụ thể và không chỉ cho bất kỳ phân phối nào. σ 12 / σ 22x2μ2σ12/σ22
whuber

1
@whuber Vâng, và nó thậm chí còn tệ hơn thế. Không khó để nấu một ví dụ với các bản phân phối không bình thường trong đó, đối với một số giá trị của , mặc dù . Các phần "có xu hướng" và "có khả năng là" trong cuộc thảo luận của tôi là lấm lem. Có lẽ người ta có thể dẫn đầu với công thức BLP (có thể lấy được nó?), Nhưng câu hỏi yêu cầu trực giác hơn là bằng chứng. E( X 1 | X 2 = x 2 )< μ 1 σ 1 , 2 >0x2>μ2E(X1|X2=x2)<μ1σ1,2>0
Hóa đơn

1
"Trực quan" không ngụ ý "không định lượng": hai người có thể đi cùng nhau. Thường rất khó để tìm thấy một đối số trực quan mang lại kết quả định lượng, nhưng thường thì nó có thể được thực hiện và quá trình tìm kiếm một đối số như vậy luôn luôn sáng tỏ.
whuber

Đoạn cuối: Tôi đã phát hiện ra rằng phân phối bình thường không quá đặc biệt: các gia đình được tạo ra bởi các phép biến đổi affine của các phân phối đối xứng tròn là những phân phối đặc biệt (trong đó có rất nhiều).
whuber

@whuber Điều đó khá thú vị. Bạn có một liên kết hoặc trích dẫn?
Hóa đơn
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.