Sự khác biệt giữa chức năng mất và chức năng quyết định là gì?


23

Tôi thấy rằng cả hai chức năng là một phần của các phương thức khai thác dữ liệu, chẳng hạn như Gradient Boosting Regressors. Tôi thấy rằng đó là những đối tượng riêng biệt quá.

Làm thế nào là mối quan hệ giữa cả hai nói chung?

Câu trả lời:


45

Hàm quyết định là hàm lấy dữ liệu làm đầu vào và đưa ra quyết định làm đầu ra. Những gì quyết định có thể được phụ thuộc vào vấn đề trong tay. Những ví dụ bao gồm:

  • Các vấn đề ước tính: "quyết định" là ước tính.
  • Vấn đề kiểm tra giả thuyết: quyết định là từ chối hoặc không bác bỏ giả thuyết khống.
  • Vấn đề phân loại: quyết định là phân loại một quan sát mới (hoặc quan sát) thành một loại.
  • Vấn đề lựa chọn mô hình: quyết định là chọn một trong những mô hình ứng cử viên.

Thông thường, có vô số hàm quyết định có sẵn cho một vấn đề. Ví dụ, nếu chúng ta quan tâm đến việc ước tính chiều cao của nam giới Thụy Điển dựa trên mười quan sát , chúng ta có thể sử dụng bất kỳ hàm quyết định nào sau đây d ( x ) :x=(x1,x2,,x10)d(x)

  • Giá trị trung bình của mẫu: .d(x)=110i=110xi
  • Trung vị của mẫu: d(x)=median(x)
  • Giá trị trung bình hình học của mẫu: d(x)=x1x1010
  • Hàm luôn trả về 1: , bất kể giá trị của x . Ngớ ngẩn, có, nhưng nó vẫn là một chức năng quyết định hợp lệ.d(x)=1x

Làm thế nào chúng ta có thể xác định chức năng quyết định nào sẽ sử dụng? Một cách là sử dụng hàm mất mát , mô tả tổn thất (hoặc chi phí) liên quan đến tất cả các quyết định có thể. Các chức năng quyết định khác nhau sẽ có xu hướng dẫn đến các loại sai lầm khác nhau. Hàm mất mát cho chúng ta biết loại sai lầm nào chúng ta nên quan tâm hơn. Hàm quyết định tốt nhất là hàm mang lại tổn thất dự kiến thấp nhất . Điều gì có nghĩa là mất mát dự kiến ​​phụ thuộc vào cài đặt (cụ thể, cho dù chúng ta đang nói về thống kê thường xuyên hoặc Bayes ).

Tóm tắt:

  • Chức năng quyết định được sử dụng để đưa ra quyết định dựa trên dữ liệu.
  • Hàm mất được sử dụng để xác định hàm quyết định nào sẽ sử dụng.

Đối với các hàm quyết định tham số (ví dụ: hồi quy logistic, quyết định ngưỡng) về cơ bản bạn có một hàm có thể cho mỗi kết hợp tham số và hàm mất được sử dụng để tìm ra hàm tốt nhất. Ví dụ phổ biến: nếu bạn sử dụng độ dốc gốc để khám phá không gian tham số, bạn sẽ lấy được tổn thất liên quan đến các tham số và giảm xuống mức tối thiểu (cục bộ) của tổn thất.
pixelou

7

Hàm mất mát là những gì được tối thiểu hóa để có được một mô hình tối ưu theo một nghĩa nào đó. Bản thân mô hình có chức năng quyết định được sử dụng để dự đoán.

Ví dụ: trong phân loại SVM:

  • L(w,ξ)= =12w2+CΣtôiξtôi
  • f(x)= =wTx+b

Đây có phải là định mức bằng khoảng cách hay tôi có trộn lẫn thứ gì đó ở đây không ... Vì vậy, hàm quyết định luôn là một phần của hàm mất mà tôi sử dụng để "so sánh" với các giá trị thực mà tôi cố gắng sửa một mô hình? Và mục tiêu là giảm thiểu "sự khác biệt" này?
www.pieronigro.de

@Hiatus định mức của siêu phẳng tách biệt (đang được tối ưu hóa khi huấn luyện một SVM) không được sử dụng trong chức năng quyết định. Các siêu phẳng chính nó được sử dụng. Giảm thiểu các chỉ tiêu trong quá trình đào tạo về cơ bản là một hình thức chính quy.
Marc Claesen

Sẽ là tốt hơn để đưa ra một câu trả lời chung chung hơn mà không bị ràng buộc với bất kỳ phân loại cụ thể.
smci
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.