Câu hỏi được gắn thẻ «loss-functions»

Một hàm được sử dụng để định lượng sự khác biệt giữa dữ liệu được quan sát và các giá trị dự đoán theo một mô hình. Tối thiểu hóa các hàm mất mát là một cách để ước tính các tham số của mô hình.

2
Có phải là thông lệ để giảm thiểu tổn thất trung bình trong các đợt thay vì tổng?
Tensorflow có một ví dụ hướng dẫn về phân loại CIFAR-10 . Trong hướng dẫn, tổn thất entropy chéo trung bình trên toàn lô được giảm thiểu. def loss(logits, labels): """Add L2Loss to all the trainable variables. Add summary for for "Loss" and "Loss/avg". Args: logits: Logits from inference(). labels: …

1
Phân rã phương sai
Trong phần 3.2 của Nhận dạng mẫu và học máy của Giám mục , ông đã thảo luận về phân rã phương sai thiên vị, nói rằng đối với hàm mất bình phương, tổn thất dự kiến ​​có thể được phân tách thành một thuật ngữ sai lệch bình phương …





5
Tôi nên sử dụng chức năng mất nào để phát hiện nhị phân trong phát hiện khuôn mặt / không mặt trong CNN?
Tôi muốn sử dụng học sâu để huấn luyện phát hiện nhị phân mặt / không mặt, tôi nên sử dụng mất gì, tôi nghĩ đó là SigmoidCrossEntropyLoss hoặc Hinge-loss . Có đúng không, nhưng tôi cũng tự hỏi có nên sử dụng softmax nhưng chỉ với hai lớp không?

1
Xấp xỉ bậc hai của hàm mất (Sách học sâu, 7.33)
Trong cuốn sách của Goodfellow (2016) về học tập sâu, ông đã nói về sự tương đương của việc dừng sớm với chính quy L2 ( https://www.deeplearningbook.org/contents/THERization.html trang 247). Xấp xỉ bậc hai của hàm chi phí jjj được cho bởi: J^(θ)=J(w∗)+12(w−w∗)TH(w−w∗)J^(θ)=J(w∗)+12(w−w∗)TH(w−w∗)\hat{J}(\theta)=J(w^*)+\frac{1}{2}(w-w^*)^TH(w-w^*) HHHf(w+ϵ)=f(w)+f′(w)⋅ϵ+12f′′(w)⋅ϵ2f(w+ϵ)=f(w)+f′(w)⋅ϵ+12f″(w)⋅ϵ2f(w+\epsilon)=f(w)+f'(w)\cdot\epsilon+\frac{1}{2}f''(w)\cdot\epsilon^2


3
Nên sử dụng hàm mất mát nào để có được phân loại nhị phân có độ chính xác cao hoặc thu hồi cao?
Tôi đang cố gắng thực hiện một trình phát hiện các đối tượng hiếm khi xảy ra (bằng hình ảnh), dự định sử dụng trình phân loại nhị phân CNN được áp dụng trong cửa sổ trượt / thay đổi kích thước. Tôi đã xây dựng các bộ kiểm tra …


2
Hàm mất phần trăm
Giải pháp cho vấn đề: minmE[|m−X|]minmE[|m−X|] \min_{m} \; E[|m-X|] được biết đến là trung vị của XXX , nhưng hàm mất mát trông như thế nào đối với các phần trăm khác? Ví dụ: phân vị thứ 25 của X là giải pháp để: minmE[L(m,X)]minmE[L(m,X)] \min_{m} \; E[ L(m,X) ] …



1
Làm thế nào để một công cụ ước tính giảm thiểu tổng trọng số của sai lệch bình phương và phương sai phù hợp với lý thuyết quyết định?
Được rồi - tin nhắn ban đầu của tôi không thể tạo ra một phản hồi; Vì vậy, hãy để tôi đặt câu hỏi khác nhau. Tôi sẽ bắt đầu bằng cách giải thích sự hiểu biết của tôi về ước tính từ góc độ lý thuyết quyết định. Tôi …

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.