Giải thích về chức năng mất 0-1

18

Tôi đang cố gắng nắm bắt mục đích của chức năng mất là gì và tôi không thể hiểu được nó.

Vì vậy, theo như tôi hiểu thì hàm mất mát là để giới thiệu một số loại số liệu mà chúng ta có thể đo lường "chi phí" của một quyết định không chính xác.

Vì vậy, giả sử tôi có bộ dữ liệu gồm 30 đối tượng, tôi chia chúng cho các tập huấn luyện / kiểm tra như 20/10. Tôi sẽ sử dụng hàm mất 0-1, vì vậy giả sử bộ nhãn lớp của tôi là M và hàm này trông như thế này :

L (i, j) = {\begin{cases} 0 i = j \\ 1 i \neq j \end{cases} i, j \in M

$L(i, j) = \begin{cases} 0 \qquad i = j \\ 1 \qquad i \ne j \end{cases} \qquad i,j \in M$

Vì vậy, tôi đã xây dựng một số mô hình trên dữ liệu đào tạo của mình, giả sử tôi đang sử dụng trình phân loại Naive Bayes và mô hình này đã phân loại đúng 7 đối tượng (gán cho chúng các nhãn lớp chính xác) và 3 đối tượng được phân loại không chính xác.

Vì vậy, chức năng mất của tôi sẽ trả về "0" 7 lần và "1" 3 lần - tôi có thể nhận được loại thông tin nào từ đó? Đó là mô hình của tôi phân loại 30% các đối tượng không chính xác? Hoặc là có nhiều đến nó?

Nếu có bất kỳ sai lầm trong cách suy nghĩ của tôi, tôi rất xin lỗi, tôi chỉ đang cố gắng học hỏi. Nếu ví dụ tôi cung cấp là "quá trừu tượng", hãy cho tôi biết, tôi sẽ cố gắng cụ thể hơn. Nếu bạn sẽ thử giải thích khái niệm này bằng cách sử dụng ví dụ khác, vui lòng sử dụng hàm mất 0-1.

machine-learning loss-functions

— Johnny Johansson
nguồn

13

Bạn đã tóm tắt chính xác chức năng mất 0-1 khi xem xét chính xác một cách hiệu quả. Số 1 của bạn trở thành chỉ số cho các mục bị phân loại sai, bất kể chúng được phân loại sai như thế nào. Vì bạn có ba trong số 10 mục, độ chính xác phân loại của bạn là 70%.

Nếu bạn thay đổi trọng số của hàm mất, cách giải thích này sẽ không áp dụng nữa. Ví dụ, trong phân loại bệnh, có thể tốn kém hơn nếu bỏ lỡ một trường hợp bệnh dương tính (âm tính giả) so với chẩn đoán sai bệnh (dương tính giả). Trong trường hợp này, chức năng mất của bạn sẽ cân nhắc phân loại sai âm tính nặng hơn. Tổng thiệt hại của bạn sẽ không còn thể hiện tính chính xác trong trường hợp này, mà là tổng "chi phí" của việc phân loại sai. Hàm mất 0-1 là duy nhất tương đương với độ chính xác, vì tất cả những gì bạn quan tâm là liệu bạn có làm đúng hay không, và không phải là lỗi được tạo ra như thế nào.

— Vương hạt nhân
nguồn

@JohnnyJohansson, đó là định nghĩa về tính tích lũy trong thống kê, xem en.wikipedia.org/wiki/Sens nhạy_and_specificity

— Tim

@Tim - Tôi vẫn bị nhầm lẫn bởi hàm mất 0-1 - ma trận kết quả có thể có bất kỳ giá trị nào lớn hơn 1, tức là nếu có 3 phân loại sai, chúng ta sẽ thấy giá trị 3 trong mục tương ứng? xem tại đây math.stackexchange.com/questions/2623072/ từ

— Xavier Bourret Sicotte

2

Vâng, về cơ bản là như vậy: bạn đếm số lượng các mục bị phân loại sai. Không có gì hơn đằng sau nó, nó là một chức năng mất rất cơ bản. Điều gì tiếp theo, mất 0-1 dẫn đến chế độ ước tính của phân phối mục tiêu (so với mất để ước tính trung bình và mất cho ước tính trung bình). $L_1$ $L_2$

— Tim
nguồn

0

Tôi nghĩ rằng sự nhầm lẫn của bạn không phân biệt sự mất mát cho một điểm dữ liệu so với sự mất mát cho toàn bộ tập dữ liệu.

Cụ thể, là mất một điểm dữ liệu (tôi đang thay đổi ký hiệu một chút). Và tổn thất cho toàn bộ tập dữ liệu, nghĩa là độ chính xác phân loại, cần tổng hợp tất cả các điểm dữ liệu. $L(y,\hat y)$

\underset{Tôi}{Σ} L (y_{Tôi}, {\hat{y}}_{Tôi})

$\sum_i L(y_i,\hat y_i)$

— Haitao Du
nguồn

Tôi thực sự nhận được sự khác biệt, nhưng thật khó để tôi hiểu tôi cần gì sự mất mát này cho một điểm dữ liệu ngoài việc tính toán tổn thất cho toàn bộ dữ liệu? Và tôi nên xem xét gì khi chọn chức năng mất thích hợp cho một số vấn đề cụ thể?

— Johnny Johansson