Sự khác biệt giữa các kỹ thuật nghịch đảo vuông và giả nhỏ nhất cho hồi quy tuyến tính là gì?


11

Tôi đang tự hỏi sự khác biệt giữa chúng. Về cơ bản, họ làm cùng một công việc khi kết thúc việc tìm các hệ số của các tham số, nhưng chúng trông chỉ khác nhau theo cách chúng ta tìm thấy các hệ số. Đối với tôi, phương pháp Least vuông dường như sử dụng sự khác biệt và dạng ma trận để tìm các hệ số và Pseudo-nghịch đảo dường như chỉ sử dụng thao tác ma trận, nhưng làm thế nào tôi có thể nói sự khác biệt giữa chúng? Hoặc không có sự khác biệt nào cả?


Theo định nghĩa, ma trận nghịch đảo Moore-Penrose cung cấp một giải pháp bình phương tối thiểu. Nhưng khái niệm bình phương tối thiểu cũng có thể được rút ra từ ước lượng khả năng tối đa theo mô hình bình thường.
Łukasz Tốt nghiệp

Câu trả lời:


13

Trong bối cảnh hồi quy tuyến tính, 'bình phương tối thiểu' có nghĩa là chúng tôi muốn tìm các hệ số giảm thiểu sai số bình phương. Nó không chỉ định cách thực hiện tối thiểu hóa này và có nhiều khả năng. Nhân vectơ phản hồi với giả hành Moore-Penrose của ma trận hồi quy là một cách để làm điều đó, và do đó là một cách tiếp cận với hồi quy tuyến tính bình phương nhỏ nhất (như những cách khác đã chỉ ra).

Sự khác biệt giữa các phương thức có thể phát sinh khi ma trận hồi quy không có thứ hạng đầy đủ. Điều này có thể xảy ra, ví dụ, khi số lượng biến vượt quá số điểm dữ liệu. Trong trường hợp này, có vô số lựa chọn về hệ số tối ưu. Các phương thức khác nhau về cách chúng chọn một giải pháp trong tập hợp vô hạn này. Đặc điểm phân biệt của phương pháp giả trong tình huống này là nó trả về giải pháp với định mức tối thiểu .2


Đây là câu trả lời đúng, nhưng tôi sẽ nói cụ thể hơn, nó trả về, giải pháp định mức L2 tối thiểu, vì có nhiều cách bạn có thể xác định định mức của mình và điều quan trọng cần lưu ý là giải pháp sẽ không phải là giải pháp tốt nhất chẳng hạn theo nghĩa chuẩn L0 và L_infinity.
boomkin

Rất đúng. Tôi có nghĩa là L2 ngầm, nhưng được chỉnh sửa để cụ thể hơn, như bạn đề xuất.
user20160

3

Nó phụ thuộc vào, ý của bạn là "kỹ thuật phân biệt". Có hai phương pháp mà tôi có thể hiểu bằng cách đó:

  • Sử dụng sự khác biệt để lấy độ dốc, sau đó thực hiện giảm độ dốc trên bề mặt lỗi. Tuy nhiên, điều này sẽ khá bất thường đối với hồi quy tuyến tính (nhưng không phải đối với các loại hồi quy khác).

  • Sử dụng sự khác biệt để lấy ra độ dốc, sau đó sử dụng độ phân giải đó để xác định mức tối thiểu bằng cách đặt độ dốc về 0.

Phương pháp đầu tiên rất khác với nghịch đảo giả. Thứ hai là không. Nếu bạn thực hiện phân biệt và giải phương trình kết quả từ việc đặt độ dốc về 0, bạn sẽ nhận được chính xác giả nghịch đảo như một giải pháp chung.

Nếu bạn nghĩ về điều này, nó có rất nhiều ý nghĩa. Nếu các kỹ thuật khác nhau sẽ dẫn đến các hệ số khác nhau, thật khó để nói, cái nào là chính xác. Nếu chúng tạo ra các hệ số tương tự, thì đó cũng là trường hợp, bạn có thể rút ra các phương trình được sử dụng cho một phương thức từ phương thức kia.


3

Như đã được chỉ ra trong các câu trả lời khác, nhân với giả ngẫu nhiên là một trong những cách để có được một giải pháp bình phương tối thiểu.

Nó rất dễ dàng để xem lý do tại sao. Giả sử bạn có điểm trong không gian chiều: kn

X=[1x11x12x13x1n1x21x22x23x2n1xk1xk2xk3xkn]

Để mỗi điểm tương ứng có một giá trị trong : Y

Y=[y1y2yk]

Bạn muốn tìm một tập các trọng số

W=[w1w2wn]

sao cho sai số bình phương giữa và được giảm thiểu, đó là giải pháp bình phương tối thiểu: , trong đó (bạn có thể dễ dàng thấy rằng là tổng các lỗi bình phương).XWYminWf(W)f(W)=(YXW)T(YXW)f(W)

Chúng tôi làm điều đó bằng cách tìm đạo hàm của bằng và đặt nó thành :f(W)W0

δfδW=δ(YXW)T(YXW)δW=δ(YTYWTXTYYTXW+WTXTXW)δW=δ(YTY2YTXWYTXW+WTXTXW)δW=δYTY2YTXW+WTXTXWδW=2YTX+2WTXTX

Đặt đạo hàm thành :0

2WTXTX=2YTX
XTXW=XTY
(XTX)1XTXW=(XTX)1XTY
W=(XTX)1XTY

Vì vậy, theo cách này chúng ta có thể rút ra ma trận nghịch đảo giả như là giải pháp cho vấn đề bình phương nhỏ nhất.


2

Giải pháp nghịch đảo giả dựa trên sai số bình phương tối thiểu, như Łukasz Grad đã chỉ ra. Đó là, bạn thực sự đang giải quyết vấn đề tối thiểu hóa,

E(W)=12(y(i)WTx(i))2

bằng cách phân biệt các lỗi wrt . Sau đó, bạn nhận được giải pháp: . (Lưu ý giả nghịch đảo không nghịch đảo. Vì vậy, bạn không thể hiểu giải pháp bằng , có vẻ như là một giải pháp từ trực tiếp với thao tác ma trận. Đây là một chủ đề khác để tìm giả - ngược lại.)WW=(XTX)1XTYX1YXW=Y

Nếu bạn đang yêu cầu về giải pháp hiệp phương sai dựa trên , nó có thể được hiểu như là một giải pháp trực tiếp dựa trên mối quan hệ tuyến tính giữa và . Trên thực tế, giải pháp này cũng được suy luận nghiêm ngặt từ sai số bình phương tối thiểu và sự khác biệt là không quan trọng so với giả nghịch đảo. Đây vẫn là giải pháp giả ngược nhưng biết rằng dòng của bạn chắc chắn sẽ đi qua điểm của các giá trị trung bình . Vì vậy, các biện pháp lỗi có thể được viết lại như,W=cov(X,Y)var(X)XY(X¯,Y¯)

E(W)=12((y(i)y¯)WT(x(i)x¯))2

Khi bạn sử dụng để đại diện cho và để đại diện cho , giải pháp của bạn với nghịch đảo giả giống như giải pháp với hiệp phương sai. Sự khác biệt là, bây giờ bạn phải tính toán chặn riêng, bởi vì, bằng cách trừ các giá trị trung bình của và , bạn hầu như tập trung vào tọa độ tại và dòng của bạn vượt qua nó, do đó đánh chặn bằng không. Bạn đã ánh xạ hệ tọa độ mới trở lại hệ tọa độ ban đầu bằng cách tính toán chặn với . xx¯xyy¯yxy(x¯,y¯)w0=y¯WTx¯

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.