Sự khác biệt giữa LeakyReLU và PReLU là gì?


42

Tôi nghĩ cả hai, PReLU và Leaky ReLU là

f(x)=max(x,αx) with α(0,1)

Keras, tuy nhiên, có cả hai chức năng trong các tài liệu .

Rò rỉ ReLU

Nguồn của LeakyReLU :

return K.relu(inputs, alpha=self.alpha)

Do đó (xem mã relu )

đụ1(x)= =tối đa(0,x)-αtối đa(0,-x)

PReLU

Nguồn của PReLU :

def call(self, inputs, mask=None):
    pos = K.relu(inputs)
    if K.backend() == 'theano':
        neg = (K.pattern_broadcast(self.alpha, self.param_broadcast) *
               (inputs - K.abs(inputs)) * 0.5)
    else:
        neg = -self.alpha * K.relu(-inputs)
    return pos + neg

Do đó

đụ2(x)= =tối đa(0,x)-αtối đa(0,-x)

Câu hỏi

Tôi đã nhận được một cái gì đó sai? Không phải đụ1đụ2 tương đương với đụ (giả sử α(0,1) ?)

Câu trả lời:


50

Trực tiếp từ wikipedia :

nhập mô tả hình ảnh ở đây

  • Rò rỉ ReLU cho phép một độ dốc nhỏ, khác không khi thiết bị không hoạt động.

  • Các tham số ReLU đưa ý tưởng này đi xa hơn bằng cách biến hệ số rò rỉ thành một tham số được học cùng với các tham số mạng thần kinh khác.


3
À, cảm ơn, tôi luôn quên rằng ReLU Leaky có là siêu tham số và ReLU tham số có làm tham số. αα
Martin Thoma

1
Đối với Google-thing: Không sao đâu . (Btw, đối với tôi câu hỏi này là kết quả thứ ba bây giờ cho "Leaky ReLU vs PReLU")
Martin Thoma

3
@MartinThoma đúng! Không có hành vi phạm tội cho điều đó! Cách tôi tìm thấy câu trả lời cũng khá ngu ngốc; Tôi không biết 'P' trong PReLU là gì, vì vậy tôi đã tìm ra điều đó và sau đó cố gắng tìm hiểu PReLU là gì chỉ bằng cách gõ 'Tham số ReLU', đưa tôi đến trang wikipedia. Tôi đã học được điều gì đó hàng ngày vì câu hỏi của bạn;)
Thomas W

1
Đẹp. Đó là cách nó phải là :-) Trong trường hợp này, tổng quan về chức năng kích hoạt nhỏ của tôi cũng có thể thú vị đối với bạn. Bài báo này (một phần) bằng tiếng Đức, nhưng tôi đoán phần đó không quan trọng
Martin Thoma
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.