Trong thuật toán SVM, tại sao vectơ w trực giao với siêu phẳng tách biệt?


13

Tôi là người mới bắt đầu học Máy. Trong SVM, siêu phẳng tách biệt được định nghĩa là . Tại sao chúng ta nói vector trực giao với siêu phẳng tách biệt?y=wTx+bw


3
Một câu trả lời cho một câu hỏi tương tự (đối với các mạng thần kinh) có ở đây .
bogatron

@bogatron - Tôi hoàn toàn đồng ý với bạn. Nhưng những người của tôi chỉ là một câu trả lời cụ thể SVM .
không có tiêu đề

2
Ngoại trừ nó không phải là. Câu trả lời của bạn là chính xác nhưng không có gì về nó cụ thể cho các SVM (cũng không nên có). chỉ đơn giản là một phương trình vectơ xác định một siêu phẳng. wTx=b
bogatron

Câu trả lời:


10

Về mặt hình học, vectơ w được định hướng trực giao với đường thẳng được xác định bởi . Điều này có thể được hiểu như sau:wTx=b

Đầu tiên lấy . Bây giờ rõ ràng là tất cả các vectơ, , với sản phẩm bên trong biến mất với thỏa mãn phương trình này, tức là tất cả các vectơ trực giao để w thỏa mãn phương trình này.b=0xw

Bây giờ dịch siêu phẳng ra khỏi gốc tọa độ trên một vectơ a. Phương trình của mặt phẳng bây giờ trở thành: , tức là chúng ta thấy rằng đối với phần bù , là hình chiếu của vectơ lên vectơ .(xa)Tw=0b=aTwaw

Do đó, không mất tính tổng quát, chúng ta có thể chọn một đường vuông góc với mặt phẳng, trong trường hợp đó chiều dài đại diện cho ngắn nhất, trực giao khoảng cách giữa nguồn gốc và siêu phẳng.||a||=|b|/||w||

Do đó vectơ được gọi là trực giao với siêu phẳng tách biệt.w


4

Lý do tại sao là bình thường đối với siêu phẳng là vì chúng ta định nghĩa nó là như vậy:w

Giả sử rằng chúng ta có một mặt phẳng (siêu) trong không gian 3d. Đặt là một điểm trên mặt phẳng này tức là P 0 = x 0 , y 0 , z 0 . Do đó, vectơ từ gốc ( 0 , 0 , 0 ) đến điểm này chỉ là < x 0 , y 0 , z 0 > . Giả sử rằng chúng ta có một điểm P ( x , y , z ) tùy ý trên mặt phẳng. Vectơ tham gia PP0P0= =x0,y0,z0(0,0,0)<x0,y0,z0>P(x,y,z)P sau đó được cho bởi: P - P 0 = < x - x 0 , y - y 0 , z - z 0 > Lưu ý rằng vectơ này nằm trong mặt phẳng.P0

P-P0= <x-x0,y-y0,z-z0>

n^

n^(P-P0)= =0
n^P-n^P0= =0
-n^P0bn^wPxw

2

wTx+b= =0xmộtxb

wTxmột+b= =0wTxb+b= =0

wT.(xmột-xb)= =0xmột-xbxbxmộtwT.(xmột-xb)wTxmột-xb


0

Sử dụng định nghĩa đại số của một vectơ là trực giao với một siêu phẳng:

 x1,x2

wT(x1-x2)= =(wTx1+b)-(wTx2+b)= =0-0= =0 .
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.