Làm thế nào một vectơ của các biến đại diện cho một siêu phẳng?


12

Tôi đang đọc các yếu tố của học thống kê và ở trang 12 (phần 2.3) một mô hình tuyến tính được ký hiệu là:

Y^=XTβ^

... Trong đó là chuyển vị của một vectơ cột của các yếu tố dự đoán / biến độc lập / đầu vào. (Nó tuyên bố trước đó "tất cả các vectơ được coi là vectơ cột" vì vậy điều này sẽ không biến thành một vectơ hàng và một vectơ cột?)XTXTβ^

Bao gồm trong là " " được nhân với hệ số tương ứng cho phép chặn (không đổi).X1

Nó tiếp tục nói:

Trong không gian đầu ra đầu vào chiều cao , đại diện cho một siêu phẳng. Nếu hằng số được bao gồm trong , thì siêu phẳng bao gồm gốc và là một không gian con; nếu không, đó là một tập hợp affine cắt -axis tại điểm .(p+1)(X, Y^)XY(0, β0^)

Liệu " " có mô tả một vectơ được hình thành bởi sự kết hợp của các yếu tố dự đoán, phần chặn của " " và không? Và tại sao việc bao gồm " " trong buộc siêu phẳng đi qua gốc tọa độ , chắc chắn rằng " " sẽ được nhân với ?(X, Y^)1Y^1X1β0^

Tôi không hiểu cuốn sách; bất kỳ trợ giúp / lời khuyên / liên kết đến các tài nguyên sẽ được đánh giá rất cao.


4
Nó có thể giúp xem xét trước. Trong trường hợp đó, , với chặn. Đây là phương trình của một dòng đi qua . Mở rộng cho kích thước cao hơn là ngay lập tức. p=1y^=β^0+xβ^β0(0,β^0)
ocram

Nếu sự giúp đỡ của @ocram là không đủ, hãy thử viết ra các vectơ và thực hiện phép nhân.
Peter Flom - Tái lập Monica

2
Đây là một bản trình bày đồ họa đẹp: blog.stata.com/2011/03/03/ . Ký hiệu là khác nhau, A có X và x của bạn là . β^
Dimitriy V. Masterov

2
Cuốn sách này sai, hoặc ít nhất đó là không phù hợp. Rõ ràng có các biến không bao gồm hằng số. Do đó, tập hợp thực sự là một siêu phẳng, nhưng không đúng khi nói rằng hằng số là "được bao gồm trong " Thay vào đó tôi nghĩ rằng cuốn sách có nghĩa là để nói hằng số được bao gồm trong hồi quy nhưng vẫn không nên được coi là một phần của . Do đó, mô hình thực sự nên được viết trong đó . Đặt ngay lập tức đưa ra khẳng định về việc chặn. p{(X,Y^)|XRp}XXY^=β^0+Xβ^β=(β1,β2,,βp)X=0
whuber

1
(Nếu chúng ta thay vì bao gồm hằng số trong , sau đó chúng ta có thể không để cho tự do thay đổi theo tất cả các : nó bị hạn chế nói dối trong một . Không gian con chiều Sơ đồ sau đó có mã hóa ít nhất là và do đó không thực sự là một "siêu phẳng".)XXRpp1{(X,Y^)}2
whuber

Câu trả lời:


4

Gọi là số lượng quan sát và là số lượng biến giải thích.NK

X thực sự là ma trậnChỉ khi chúng ta nhìn vào một quan sát duy nhất, chúng ta biểu thị mỗi quan sát thường là - một vectơ hàng của các biến giải thích của một vô hướng quan sát cụ thể nhân với vectơ cột cột . Hơn nữa, là một vectơ cột , giữ tất cả các quan sát .N×KxiTK×1βYN×1Yn

Bây giờ, một siêu phẳng hai chiều sẽ trải rộng giữa các vector và một (!) Vector cột của . Hãy nhớ rằng là một ma trận, vì vậy mỗi biến giải thích được thể hiện bằng đúng một vector cột của ma trận . Nếu chúng ta chỉ có một biến giải thích, không có đánh chặn và , tất cả các điểm dữ liệu đều nằm dọc theo mặt phẳng 2 chiều kéo dài bởi và .YXXN×KXYYX

Đối với hồi quy bội, tổng siêu phẳng giữa và ma trận có bao nhiêu chiều? Trả lời: Vì chúng ta có các vectơ cột của các biến giải thích trong , nên chúng ta phải có một siêu phẳng chiều.YXKXK+1

Thông thường, trong cài đặt ma trận, hồi quy yêu cầu chặn liên tục không thiên vị để phân tích hợp lý hệ số độ dốc. Để phù hợp với thủ thuật này, chúng tôi buộc một cột của ma trận chỉ bao gồm " s". Trong trường hợp này, công cụ ước tính đứng một mình nhân với một hằng số cho mỗi quan sát thay vì một biến giải thích ngẫu nhiên. Do đó, hệ số biểu thị giá trị mong đợi của khi được giữ cố định với giá trị 1 và tất cả các biến khác đều bằng không. Do đó, siêu phẳng đa chiều bị giảm một chiều xuống không gian con -chiều vàX1β1β1Yx1iK+1Kβ1 tương ứng với "đánh chặn" của mặt phẳng -chiều này.K

Trong cài đặt ma trận, luôn luôn nên xem xét trường hợp đơn giản gồm hai chiều, để xem liệu chúng ta có thể tìm thấy một trực giác cho kết quả của mình không. Ở đây, cách dễ nhất là nghĩ về hồi quy đơn giản với hai biến giải thích: hoặc được biểu thị theo cách khác trong đại số Matrix: trong đó là a ma trận.

yi=β1x1i+β2x2i+ui
Y=Xβ+uXN×2

<Y,X> kéo dài một siêu phẳng 3 chiều.

Bây giờ nếu chúng ta buộc tất cả là tất cả , chúng ta sẽ có được: , đó là hồi quy đơn giản thông thường của chúng ta có thể được biểu diễn trong biểu đồ hai chiều . Lưu ý rằng hiện đã được giảm xuống thành một dòng hai chiều - một tập hợp con của siêu phẳng 3 chiều ban đầu. Hệ số tương ứng với việc chặn đường cắt tại .x11

yi=β1i+β2x2i+ui
X, Y<Y,X>β1x2i=0

Có thể thấy thêm rằng nó cũng đi qua khi bao gồm hằng số . Nếu chúng ta bỏ đi hằng số, siêu phẳng hồi quy luôn vượt qua tầm thường - không còn nghi ngờ gì nữa. Điều này khái quát cho nhiều thứ nguyên, như sẽ thấy sau này khi xuất phát : Vì có thứ hạng đầy đủ trên mỗi định nghĩa, , và do đó hồi quy sẽ đi qua gốc nếu chúng ta bỏ qua phần chặn.< 0 , 0 > β ( X ' X ) β = X ' y<0,β1><0,0>βX y - X β = 0

(XX)β=Xy(XX)βXy=0X(yXβ)=0.
XyXβ=0

( Chỉnh sửa: Tôi chỉ nhận ra rằng cho câu hỏi thứ hai của bạn này là hoàn toàn ngược lại của bạn đã viết regading bao gồm hoặc loại trừ các hằng số Tuy nhiên, tôi đã nghĩ ra giải pháp ở đây và tôi đứng sửa chữa nếu tôi sai cho người khác.. )

Tôi biết rằng biểu diễn ma trận của hồi quy có thể khá khó hiểu khi bắt đầu nhưng cuối cùng nó đơn giản hóa rất nhiều khi lấy đại số phức tạp hơn. Mong cái này giúp được chút ít.


1

Tôi nghĩ cách nghĩ về nó là sắp xếp lại phương trình đó:

Y^XTβ^=0

Cách duy nhất bạn sẽ có được phương trình tuyến tính đó để bao gồm gốc tọa độ là làm cho dự đoán bằng với phần chặn. Và cách để ước tính giá trị đó là bao gồm một thuật ngữ chặn trong mô hình hồi quy.

Y^
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.