Lựa chọn trong số các quy tắc chấm điểm thích hợp


22

Hầu hết các tài nguyên về quy tắc tính điểm thích hợp đề cập đến một số quy tắc tính điểm khác nhau như mất log, điểm Brier hoặc ghi hình cầu. Tuy nhiên, họ thường không đưa ra nhiều hướng dẫn về sự khác biệt giữa chúng. (Triển lãm A: Wikipedia .)

Chọn mô hình tối đa hóa điểm số logarit tương ứng với việc chọn mô hình khả năng tối đa, có vẻ như là một đối số tốt để sử dụng tính điểm logarit. Có những biện minh tương tự cho Brier hoặc chấm điểm hình cầu, hoặc các quy tắc tính điểm khác? Tại sao ai đó sẽ sử dụng một trong số này thay vì ghi điểm logarit?


2
Một số gợi ý là trong danh pháp. "Chi phí chức năng" là từ tối ưu hóa hoặc kỹ thuật hệ thống điều khiển tối ưu. Không có "tốt nhất". Để có một "điều tốt" có nghĩa là bạn phải có một thước đo về lòng tốt. Có vô số các gia đình đo lường lòng tốt. Một ví dụ tầm thường là: con đường tốt nhất là gì? Nếu bạn đang diễu hành để thực hiện - làm cho nó dài dễ chịu. Nếu bạn đang đi đến kim loại Trường của bạn, làm cho nó ngắn nhất. Chuyên môn hệ thống giúp bạn chọn các biện pháp tốt. Khi bạn có thước đo về lòng tốt, thì bạn có thể tìm thấy "tốt nhất".
EngrStudent - Phục hồi Monica


1
Tôi đã tự do chỉnh sửa tiêu đề để làm cho nó chính xác hơn / nhiều thông tin hơn. Nếu tôi giải thích sai, xin lỗi và cảm thấy thoải mái để hoàn nguyên thay đổi.
Richard Hardy

Câu trả lời:


18

Tại sao ai đó sẽ sử dụng một trong số này thay vì ghi điểm logarit?

Vì vậy, lý tưởng nhất, chúng tôi luôn phân biệt việc phù hợp với một mô hình với việc đưa ra quyết định . Trong phương pháp Bayes, việc chấm điểm & lựa chọn mô hình phải luôn luôn được thực hiện bằng cách sử dụng khả năng cận biên . Sau đó, bạn sử dụng mô hình để đưa ra dự đoán xác suất và hàm mất mát của bạn cho bạn biết cách hành động theo những dự đoán đó.

Thật không may trong thế giới thực, hiệu suất tính toán thường chỉ ra rằng chúng ta đưa ra lựa chọn mô hình và ra quyết định và do đó sử dụng hàm mất mát để phù hợp với các mô hình của chúng ta. Đây là nơi chủ quan trong lựa chọn mô hình leo vào, bởi vì bạn phải đoán xem có bao nhiêu loại sai lầm khác nhau sẽ khiến bạn phải trả giá. Ví dụ kinh điển là chẩn đoán ung thư: đánh giá quá cao khả năng mắc bệnh ung thư của một người nào đó là không tốt, nhưng đánh giá thấp thì tệ hơn nhiều.

Bên cạnh đó, nếu bạn đang tìm kiếm hướng dẫn về cách chọn quy tắc tính điểm, bạn cũng có thể muốn tìm hướng dẫn về cách chọn chức năng mất hoặc thiết kế chức năng tiện ích, vì tôi nghĩ rằng tài liệu về hai chủ đề này rất nhiều đồ sộ hơn.


3
1. lỗi mô hình làm cho?
Ben Kuhn

2) Bạn có bất kỳ ví dụ cụ thể nào về cài đặt trong đó ai đó có thể chọn Brier hoặc chấm điểm hình cầu so với tính điểm ghi nhật ký (= khả năng cận biên, như tôi hiểu không) vì những lý do đó?
Ben Kuhn

3) Tại sao nó sẽ hoạt động tốt hơn để đưa các giả định chức năng mất / tiện ích của bạn vào mô hình hơn là phù hợp với khả năng cận biên và sử dụng chức năng mất / tiện ích của bạn khi thực sự đưa ra quyết định? Có vẻ như đối với các thuật toán học tập lý tưởng không nên có khoảng cách giữa chúng.
Ben Kuhn

3
1) Đúng. 2) Không phải cá nhân, không. Các quy tắc chấm điểm không phải là "mốt" trong bit ML mà tôi làm việc. Có một cú chọc nhanh trên Học giả , có vẻ như chúng nói chung hơi lỗi thời. Bài báo này có vẻ như nó thú vị với bạn mặc dù. 3) Theo hiệu suất, tôi có nghĩa là "hiệu suất tính toán", không phải "hiệu suất dự đoán".
Andy Jones
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.