Tóm tắc
Mỗi câu trong câu hỏi có thể được hiểu là một thuộc tính của dấu chấm lửng. Các chỉ bất động sản đặc biệt đến sự phân bố bình thường hai biến đó là cần thiết là một thực tế rằng trong một tiêu chuẩn hai biến phân phối bình thường của --cho đó và là không tương quan - phương sai có điều kiện của không phụ thuộc vào . (Điều này đến lượt nó là một hậu quả ngay lập tức của thực tế là thiếu sự tương quan hàm ý sự độc lập cho các biến Bình thường chung.)X Y Y XX,YXYYX
Phân tích sau đây cho thấy chính xác tính chất nào của dấu chấm lửng có liên quan và rút ra tất cả các phương trình của câu hỏi bằng cách sử dụng các ý tưởng cơ bản và số học đơn giản nhất có thể, theo cách dễ dàng ghi nhớ.
Phân phối đối xứng tròn
Phân phối của câu hỏi là một thành viên của gia đình phân phối chuẩn bivariate. Tất cả chúng đều có nguồn gốc từ một thành viên cơ bản, chuẩn bivariate Standard , mô tả hai phân phối chuẩn tiêu chuẩn không tương thích (tạo thành hai tọa độ của nó).
Phía bên trái là một biểu đồ cứu trợ của mật độ chuẩn bivariate tiêu chuẩn. Phía bên phải hiển thị tương tự trong giả 3D, với phần phía trước được cắt đi.
Đây là một ví dụ về phân bố đối xứng tròn : mật độ thay đổi theo khoảng cách từ một điểm trung tâm nhưng không theo hướng từ điểm đó. Do đó, các đường viền của đồ thị của nó (ở bên phải) là các vòng tròn.
Tuy nhiên, hầu hết các phân phối chuẩn khác thường không đối xứng tròn: mặt cắt ngang của chúng là các hình elip. Những hình elip này mô hình hình dạng đặc trưng của nhiều đám mây điểm bivariate.
Đây là chân dung của phân phối chuẩn bivariate với ma trận hiệp phương sai Đó là một mô hình cho dữ liệu với hệ số tương quan .-2/3Σ=(1−23−231).−2/3
Cách tạo Ellipses
Một hình elip - theo định nghĩa lâu đời nhất của nó - là một phần hình nón, là một hình tròn bị biến dạng bởi hình chiếu lên một mặt phẳng khác. Bằng cách xem xét bản chất của phép chiếu, giống như các nghệ sĩ thị giác làm, chúng ta có thể phân tách nó thành một chuỗi các biến dạng dễ hiểu và dễ tính toán.
Đầu tiên, kéo dài (hoặc, nếu cần, bóp) vòng tròn dọc theo cái sẽ trở thành trục dài của hình elip cho đến khi nó có độ dài chính xác:
Tiếp theo, ép (hoặc kéo dài) hình elip này dọc theo trục nhỏ của nó:
Thứ ba, xoay nó quanh tâm của nó thành hướng cuối cùng của nó:
Cuối cùng, chuyển nó đến vị trí mong muốn:
Đây là tất cả các biến đổi affine. (Trong thực tế, ba biến đổi đầu tiên là các phép biến đổi tuyến tính ; sự dịch chuyển cuối cùng làm cho nó có liên quan.) Bởi vì một thành phần của các phép biến đổi affine vẫn (theo định nghĩa) vẫn còn affine, biến dạng ròng từ vòng tròn đến hình elip cuối cùng là một phép biến đổi affine. Nhưng nó có thể hơi phức tạp:
Lưu ý những gì đã xảy ra với các trục (tự nhiên) của hình elip: sau khi chúng được tạo ra bởi sự dịch chuyển và ép, chúng (tất nhiên) đã xoay và dịch chuyển cùng với chính trục đó. Chúng ta dễ dàng nhìn thấy các trục này ngay cả khi chúng không được vẽ, bởi vì chúng là các trục đối xứng của chính hình elip.
Chúng tôi muốn áp dụng sự hiểu biết của chúng tôi về các hình elip để hiểu các phân phối đối xứng hình tròn bị biến dạng, giống như gia đình Bình thường bivariate. Thật không may, có một vấn đề với những biến dạng này : chúng không tôn trọng sự phân biệt giữa trục và . Vòng quay ở bước 3 hủy hoại mà. Nhìn vào các lưới tọa độ mờ trong nền: chúng hiển thị những gì xảy ra với lưới (của lướiy 1 / 2 xxy1/2theo cả hai hướng) khi nó bị biến dạng. Trong hình ảnh đầu tiên, khoảng cách giữa các đường thẳng đứng ban đầu (hiển thị rắn) được nhân đôi. Trong hình ảnh thứ hai, khoảng cách giữa các đường ngang ban đầu (hiển thị nét đứt) được thu hẹp bằng một phần ba. Trong hình ảnh thứ ba, các khoảng cách lưới không được thay đổi, nhưng tất cả các dòng được xoay. Họ dịch chuyển lên và sang phải trong hình ảnh thứ tư. Hình ảnh cuối cùng, hiển thị kết quả thực, hiển thị lưới kéo dài, vắt, xoay, dịch chuyển này. Các đường liền nét ban đầu của tọa độ không đổi không còn là chiều dọc.x
Ý tưởng then chốt --one có thể mạo hiểm để nói nó là các điểm then chốt của hồi quy - là có một cách thức mà các vòng tròn có thể bị bóp méo thành một hình elip mà không xoay đường dọc . Bởi vì vòng quay là thủ phạm, chúng ta hãy cắt theo đuổi và chỉ ra cách tạo ra một hình elip xoay mà không thực sự xuất hiện để xoay bất cứ thứ gì !
Đây là một biến đổi lệch. Nó thực sự làm hai việc cùng một lúc:
Nó ép theo hướng (bằng một lượng , nói). Điều này để lại -axis một mình.λ xyλx
Nó nâng bất kỳ điểm kết quả bằng một tỷ lệ trực tiếp với . Viết hằng số tỷ lệ đó là , điều này sẽ gửi đến .x ρ ( x , y ) ( x , y + ρ x )(x,y)xρ(x,y)(x,y+ρx)
Bước thứ hai nâng -axis vào dòng , được hiển thị trong hình trước. Như thể hiện trong hình đó, tôi muốn làm việc với một phép biến đổi nghiêng đặc biệt, một phép xoay hình elip 45 độ một cách hiệu quả và ghi nó vào hình vuông đơn vị. Trục chính của hình elip này là đường . Rõ ràng là rõ ràng rằng . (Giá trị âm của nghiêng hình elip xuống bên phải thay vì lên bên phải.) Đây là giải thích hình học của "hồi quy trung bình".y = ρ x y = x | ρ | ≤ 1 ρxy=ρxy=x|ρ|≤1ρ
Chọn một góc 45 độ làm cho hình elip đối xứng quanh đường chéo của hình vuông (một phần của đường ). Để tìm ra các tham số của phép biến đổi nghiêng này, hãy quan sát:y=x
Việc nâng bằng di chuyển điểm đến .( 1 , 0 ) ( 1 , ρ )ρx(1,0)(1,ρ)
Đối xứng xung quanh đường chéo chính sau đó ngụ ý điểm cũng nằm trên hình elip.(ρ,1)
Điểm này bắt đầu từ đâu?
Điểm ban đầu (phía trên) trên vòng tròn đơn vị (có phương trình ngầm định ) với tọa độ là .x2+y2=1xρ(ρ,1−ρ2−−−−−√)
Bất kỳ điểm nào của biểu mẫu trước tiên được ép thành và sau đó được nâng lên .(ρ,y)(ρ,λy)(ρ,λy+ρ×ρ)
Giải pháp duy nhất cho phương trình là . Đó là số lượng mà tất cả các khoảng cách theo hướng dọc phải được nén để tạo hình elip ở góc 45 độ khi nó bị lệch theo chiều dọc của .(ρ,λ1−ρ2−−−−−√+ρ2)=(ρ,1)λ=1−ρ2−−−−−√ρ
Để củng cố những ý tưởng này, đây là một hoạt cảnh cho thấy cách phân phối đối xứng tròn bị biến dạng thành các phân phối với các đường viền hình elip bằng các phép biến đổi nghiêng này. Các bảng hiển thị các giá trị của bằng và từ trái sang phải.ρ0, 3/10, 6/10,9/10,
Hình ngoài cùng bên trái cho thấy một tập hợp các điểm bắt đầu xung quanh một trong các đường viền tròn cũng như một phần của trục ngang. Các số liệu tiếp theo sử dụng các mũi tên để chỉ ra cách các điểm đó được di chuyển. Hình ảnh của trục ngang xuất hiện dưới dạng một đoạn đường xiên (có độ dốc ). (Các màu đại diện cho các lượng mật độ khác nhau trong các hình khác nhau.)ρ
Ứng dụng
Chúng tôi đã sẵn sàng để làm hồi quy. Một phương pháp chuẩn, thanh lịch (nhưng đơn giản) để thực hiện hồi quy trước tiên là biểu thị các biến ban đầu trong các đơn vị đo lường mới: chúng tôi tập trung chúng vào phương tiện của chúng và sử dụng độ lệch chuẩn của chúng làm đơn vị. Điều này di chuyển trung tâm của phân phối đến gốc và làm cho tất cả các đường viền hình elip của nó nghiêng 45 độ (lên hoặc xuống).
Khi các dữ liệu được tiêu chuẩn hóa này tạo thành một đám mây điểm tròn, hồi quy rất dễ dàng: phương tiện có điều kiện trên đều bằng , tạo thành một dòng đi qua gốc. (Đối xứng tròn ngụ ý đối xứng với trục , cho thấy rằng tất cả các phân phối có điều kiện là đối xứng, vì chúng có phương tiện. , tất cả các giá trị (được chuẩn hóa) được nhân với cho một số giá trị của ; tiếp theo, tất cả các giá trị với tọa độ được xiên theo chiều dọc bởix0x0y1−ρ2−−−−−√ρxρx. Những biến dạng này đã làm gì đối với đường hồi quy (vẽ đồ thị có nghĩa là có điều kiện chống lại )?x
Việc thu hẹp tọa độ nhân tất cả các độ lệch dọc bằng một hằng số. Điều này chỉ thay đổi tỷ lệ dọc và để lại tất cả các phương tiện có điều kiện không thay đổi ở .y0
Phép biến đổi xiên dọc đã thêm vào tất cả các giá trị có điều kiện tại , do đó thêm vào trung bình điều kiện của chúng: đường cong là đường hồi quy, hóa ra là một đường.ρxxρxy=ρx
Tương tự, chúng tôi có thể xác minh rằng vì -axis là bình phương nhỏ nhất phù hợp với phân bố đối xứng tròn, nên bình phương nhỏ nhất phù hợp với phân phối đã chuyển đổi cũng là đường : đường bình phương nhỏ nhất trùng với đường hồi quy .xy=ρx
Những kết quả đẹp này là kết quả của thực tế là phép biến đổi xiên dọc không thay đổi bất kỳ tọa độ nào .x
Chúng ta có thể dễ dàng nói nhiều hơn:
Viên đạn đầu tiên (về thu hẹp) cho thấy rằng khi có bất kỳ phân phối đối xứng tròn nào , phương sai điều kiện của được nhân với .(X,Y)Y|X(1−ρ2−−−−−√)2=1−ρ2
Tổng quát hơn: phép biến đổi xiên dọc sẽ hủy bỏ mỗi phân phối có điều kiện theo và sau đó gần đây nó bằng .1−ρ2−−−−−√ρx
Đối với phân phối chuẩn bivariate chuẩn, phương sai điều kiện là một hằng số (bằng ), không phụ thuộc vào . Chúng tôi ngay lập tức kết luận rằng sau khi áp dụng phép biến đổi nghiêng này, phương sai có điều kiện của độ lệch dọc vẫn là một hằng số và bằng . Bởi vì các bản phân phối có điều kiện của Bình thường bivariate là Bình thường, bây giờ chúng tôi biết phương tiện và phương sai của chúng, chúng tôi có thông tin đầy đủ về chúng.1x1−ρ2
Cuối cùng, chúng ta cần liên hệ với ma trận hiệp phương sai ban đầu . ρΣ Đối với điều này, hãy nhớ rằng định nghĩa (đẹp nhất) của hệ số tương quan giữa hai biến và được tiêu chuẩn hóa là kỳ vọng của sản phẩm của chúng . (Tương quan của và được khai báo đơn giản là tương quan của các phiên bản được tiêu chuẩn hóa của chúng.) Do đó, khi tuân theo bất kỳ phân phối đối xứng tròn nào và chúng tôi áp dụng phép biến đổi nghiêng cho các biến, chúng tôi có thể viếtXYXYXY(X,Y)
ε=Y−ρX
đối với độ lệch dọc từ đường hồi quy và lưu ý rằng phải có phân phối đối xứng quanh . Tại sao? Bởi vì trước khi việc chuyển đổi nghiêng đã được áp dụng, đã có một phân phối đối xứng xung quanh và sau đó chúng tôi (a) vắt nó và (b) dỡ bỏ nó bằng . Cái trước không thay đổi tính đối xứng của nó trong khi cái sau lấy lại nó tại , QED. Hình tiếp theo minh họa điều này.ε0Y0ρXρX
Các đường màu đen vạch ra độ cao tỷ lệ thuận với mật độ có điều kiện ở các giá trị cách đều đặn khác nhau của . Đường trắng dày là đường hồi quy, đi qua tâm đối xứng của mỗi đường cong có điều kiện. Biểu đồ này hiển thị trường hợp trong tọa độ chuẩn.xρ=−1/2
hậu quả là
E(XY)=E(X(ρX+ε))=ρE(X2)+E(Xε)=ρ(1)+0=ρ.
Sự bình đẳng cuối cùng là do hai sự thật: (1) vì đã được chuẩn hóa, kỳ vọng của hình vuông của nó là phương sai chuẩn hóa của nó, bằng khi xây dựng; và (2) kỳ vọng của bằng với kỳ vọng của nhờ vào tính đối xứng của . Bởi vì cái sau là âm của cái trước, cả hai phải bằng : thuật ngữ này bỏ đi.X1XεX(−ε)ε0
Chúng tôi đã xác định được các thông số của sự biến đổi nghiêng, , như là hệ số tương quan của và .ρXY
Kết luận
Bằng cách quan sát rằng bất kỳ hình elip nào cũng có thể được tạo ra bằng cách làm biến dạng một vòng tròn với phép biến đổi xiên dọc giữ nguyên tọa độ , chúng ta đã hiểu được các đường viền của bất kỳ phân phối biến ngẫu nhiên nào có được từ một đối xứng tròn một bằng các phương tiện kéo dài, ép, xoay và dịch chuyển (nghĩa là, bất kỳ chuyển đổi affine nào). Bằng cách biểu thị lại kết quả theo đơn vị ban đầu của và - số tiền để thêm lại phương tiện của họ, và , sau khi nhân với độ lệch chuẩn của họ và - chúng tôi thấy rằng:x(X,Y)xyμxμyσxσy
Cả đường bình phương nhỏ nhất và đường hồi quy đều đi qua gốc của các biến được tiêu chuẩn hóa, tương ứng với "điểm trung bình" trong tọa độ ban đầu.(μx,μy)
Đường cong hồi quy, được xác định là quỹ tích của các phương tiện có điều kiện, trùng với đường bình phương nhỏ nhất.{(x,ρx)},
Độ dốc của đường hồi quy trong tọa độ chuẩn là hệ số tương quan ; do đó, trong các đơn vị ban đầu, nó bằng với .ρσyρ/σx
Do đó phương trình của đường hồi quy là
y=σyρσx(x−μx)+μy.
- Phương sai điều kiện của là với phương sai điều kiện của trong đó có phân phối chuẩn (đối xứng tròn với phương sai đơn vị ở cả hai tọa độ), và .Y|Xσ2y(1−ρ2)Y′|X′(X′,Y′)X′=(X−μX)/σxY′=(Y−μY)/σY
Không có kết quả nào trong số này là một thuộc tính cụ thể của các bản phân phối chuẩn bivariate! Đối với gia đình Bình thường bivariate, phương sai có điều kiện của là hằng số (và bằng ): thực tế này làm cho gia đình đó đặc biệt đơn giản để làm việc. Đặc biệt:Y′|X′1
- Bởi vì trong ma trận hiệp phương sai các hệ số là và phương sai có điều kiện của cho phân phối chuẩn bivariate làΣσ11=σ2x, σ12=σ21=ρσxσy,σ22=σ2y,Y|X
σ2y(1−ρ2)=σ22(1−(σ12σ11σ22−−−−−√)2)=σ22−σ212σ11.
Ghi chú kỹ thuật
Ý tưởng chính có thể được nêu trong các điều khoản của ma trận mô tả các phép biến đổi tuyến tính. Nó đi xuống để tìm một "căn bậc hai" phù hợp của ma trận tương quan mà là một hàm riêng. Do vậy:y
(1ρρ1)=AA′
Ở đâu
A=(1ρ01−ρ2−−−−−√).
Một căn bậc hai được biết đến nhiều hơn là một căn nguyên được mô tả ban đầu (liên quan đến một phép quay thay vì một phép biến đổi nghiêng); nó là cái được tạo ra bởi sự phân rã giá trị số ít và nó đóng một vai trò nổi bật trong phân tích thành phần chính (PCA):
(1ρρ1)=BB′;
B=Q(ρ+1−−−−√001−ρ−−−−√)Q′
trong đó là ma trận xoay cho xoay độ.Q=⎛⎝12√12√−12√12√⎞⎠45
Do đó, sự khác biệt giữa PCA và hồi quy bắt nguồn từ sự khác biệt giữa hai căn bậc hai đặc biệt của ma trận tương quan.