Các bước để chuyển tổng bình phương có trọng số thành dạng ma trận là gì?


8

Tôi mới chuyển đổi công thức sang dạng ma trận. Nhưng điều này là cần thiết cho mã máy học hiệu quả. Vì vậy, tôi muốn hiểu cách "đúng", không phải những thứ cao bồi tôi làm.

Được rồi, chúng ta đi, tôi đang cố gắng chuyển đổi tổng bình phương có trọng số từ dạng bên dưới thành dạng ma trận. Tôi thường thấy dạng ma trận tương đương với dạng bên dưới và không có lời giải thích nào được đưa ra về cách nó được dẫn xuất.

J(w)=i=1mui(wTxiyi)2

Trong đó là trọng số cho mỗi lỗi mẫu i . Ngoài ra, x iR n , w R n , y R , u iR , i = 1 , . . . , m . w T x i là giá trị dự đoán, kết quả của việc nhân một vectơ trọng số với một vectơ đặc trưng.uiixiRnwRnyRuiRi=1,...,mwTxi

Đây là những gì tôi nghĩ, và tôi có được sáng tạo. Vì vậy, hãy thoải mái bỏ qua đến cuối cùng nếu tôi tiếp tục.

Đặt là một vectơ cột của các hàm đại diện cho lỗi không bình phương. Chúng ta có thể biểu diễn ( w T x i - y i ) 2 trên i = 1 , . . . , mr(wTxiyi)2i=1,...,m

(1)r2=[r1r2rm][r1r2rm]

Các kết quả của vector nhân với m × 1 vector là một 1 × 1 ma trận (vô hướng).1×mm×11×1

Đặt là một vectơ có trọng số cho từng lỗi mẫu. Vì chúng ta cần cân các lỗi bình phương, chúng ta cần kết hợp u trong Công thức 1 trước khi lấy vô hướng. Vì chúng ta muốn r đầu tiên duy trì dưới dạng vectơ 1 × m , chúng tôi xác định U là ma trận đường chéo với các số hạng chéo đến từ u . Chúng tôi hiện có:uu1r1×mUu

(2)J(w)=[r1r2rm][u1000u2000um][r1r2rm]

Chúng ta có thể đơn giản hóa điều này thành

(3)J(w)=rTUr

rxiRnwRnXwm×nwn×1m×1y=1,...,mr=(Xwy)3

(4)J(w)=(Xwy)TU(Xwy)

Đầu tiên, điều này có ý nghĩa? Thứ hai, và quan trọng nhất, đây có thực sự là cách bạn phải làm không?

Cảm ơn



+1: Hài hước khi bạn nghĩ rằng bạn đang làm 'đồ cao bồi'. Đây chính xác là cách để làm điều đó, nhưng tôi sẽ không bao giờ viết nó ra một cách toàn diện (công việc rất tốt!). Đây là một chương của một cuốn sách của khóa học kinh tế lượng 1 của tôi trong quá trình nghiên cứu kinh tế lượng của tôi. Trang 120 giải thích cách viết lại hàm (dễ) thành ký hiệu ma trận và trang 121 là ví dụ của bạn mà không có trọng số (mặc dù ký hiệu hơi khác nhau). Nếu tôi nhớ chính xác, một chương khác cũng xử lý các công cụ ước tính của WLS (về cơ bản là biểu thức của bạn).
Marcel10

Co vẻ tôt vơi tôi.
Matthew Gunn

Câu trả lời:


1

Tôi sẽ mạo hiểm trả lời cho câu hỏi này: Mọi thứ bạn trình bày đều đúng.

β^WLS=(XTWX)(XTWY)X1n×1

wuX=[x],W=diag(u),β=[w]

Các giấy tờ chứng minh của định lý Gauss Markov là do mâu thuẫn. Xem ở đây . Điều đó có nghĩa là chúng ta không phân tích được một công cụ ước tính như vậy trực tiếp từ hàm mất mát. Bạn có thể đã thấy một cách tiếp cận như vậy được sử dụng với các phương trình ước lượng hồi quy tuyến tính và logistic.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.