Có nghĩa là gì khi chia sẻ các tham số giữa các tính năng và các lớp


Câu trả lời:


22

Tôi sẽ cố gắng trả lời câu hỏi này thông qua hồi quy logistic , một trong những phân loại tuyến tính đơn giản nhất.

Trường hợp đơn giản nhất của hồi quy logistic là nếu chúng ta có một nhiệm vụ phân loại nhị phân ( và chỉ có một tính năng đầu vào ( ). Trong trường hợp này, đầu ra của hồi quy logistic sẽ là:y{0,1})xR

y^=σ(wx+b)
trong đó wb đều là vô hướng . Đầu ra của mô hình y^[0,1] tương ứng với xác suất x sẽ thuộc loại 1 .

Chúng tôi sẽ cố gắng chia cụm từ "phân loại tuyến tính không chia sẻ tham số giữa các tính năng và lớp" thành hai phần. Chúng tôi sẽ kiểm tra các trường hợp của nhiều tính năng và nhiều lớp riêng biệt để xem liệu hồi quy logistic có chia sẻ tham số cho bất kỳ tác vụ nào không:

Các phân loại tuyến tính chia sẻ các tham số giữa các tính năng?

Trong trường hợp này, với mỗi ví dụ, y là một vô hướng lấy các giá trị nhị phân (như trước), trong khi x là một vectơ có độ dài N (trong đó N là số lượng các tính năng). Ở đây, đầu ra là sự kết hợp tuyến tính của các tính năng đầu vào (nghĩa là tổng trọng số của các tính năng này cộng với các sai lệch).

x w N xw w i x i

y^=σ(iN(wixi)+b)orσ(wx+b)
nơi và là vector có độ dài . Sản phẩm tạo ra một vô hướng. Như bạn có thể thấy ở trên, có một trọng số riêng biệt cho mỗi tính năng đầu vào và các trọng số này là độc lập bởi tất cả các phương tiện. Từ đó, chúng ta có thể kết luận rằng không có chia sẻ tham số giữa các tính năng .xwNxw wixi

Các phân loại tuyến tính chia sẻ các tham số giữa các lớp?

Trong trường hợp này là vô hướng, tuy nhiên là vectơ có độ dài (trong đó là số lớp). Để giải quyết vấn đề này, hồi quy logistic về cơ bản tạo ra một đầu ra riêng cho mỗi lớpMỗi đầu ra là một vô hướng và tương ứng với xác suất thuộc về lớp .xyMMyjMyj[0,1]xj

y^=wx+b,wherey^=y^1,y^2,...,yM

Cách dễ nhất để nghĩ về điều này là hồi quy logistic độc lập đơn giản với mỗi đầu ra là:M

y^j=σ(wjx+bj)

Từ những điều trên, rõ ràng là không có trọng số nào được chia sẻ giữa các lớp khác nhau .

đa tính năng và đa lớp :

Bằng cách kết hợp hai trường hợp trên, cuối cùng chúng ta cũng có thể đạt được trường hợp chung nhất của nhiều tính năng và nhiều lớp:

y^=σ(Wx+b)
y^MxNbMW(N×M)

Trong mọi trường hợp, các phân loại tuyến tính không chia sẻ bất kỳ tham số nào giữa các tính năng hoặc các lớp .

Để trả lời câu hỏi thứ hai của bạn, các trình phân loại tuyến tính có một giả định cơ bản rằng các tính năng cần phải độc lập , tuy nhiên đây không phải là điều mà tác giả của bài báo dự định nói.


1
Giải thích tốt đẹp. :)
joydeep bhattacharjee
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.