Giải thích trực quan về logloss


10

Trong một số cuộc thi kaggle, việc tính điểm được dựa trên "logloss". Điều này liên quan đến lỗi phân loại.

Đây là một câu trả lời kỹ thuật nhưng tôi đang tìm kiếm một câu trả lời trực quan. Tôi thực sự thích câu trả lời cho câu hỏi này về khoảng cách Mahalanobis, nhưng PCA không phải là logloss.

Tôi có thể sử dụng giá trị mà phần mềm phân loại của tôi đưa ra, nhưng tôi không thực sự hiểu nó. Tại sao chúng ta sử dụng nó thay vì tỷ lệ dương / âm đúng / sai? Bạn có thể giúp tôi để tôi có thể giải thích điều này với bà tôi hoặc một người mới trong lĩnh vực này?

Tôi cũng thích và đồng ý với trích dẫn:

bạn không thực sự hiểu điều gì trừ khi bạn có thể giải thích nó với bà của bạn
- Albert Einstein

Tôi đã cố gắng tự trả lời điều này trước khi đăng ở đây.

Các liên kết mà tôi không tìm thấy trực quan hoặc thực sự hữu ích bao gồm:

Đây là những thông tin, và chính xác. Chúng có nghĩa là cho một khán giả kỹ thuật. Họ không vẽ một bức tranh đơn giản, hoặc đưa ra một ví dụ đơn giản và dễ tiếp cận. Chúng không được viết cho bà tôi.


bạn đã không cung cấp một liên kết đến câu trả lời kỹ thuật của bạn
bdeonovic


@ EhsanM.Kermani - Tôi không tìm thấy những thứ trực quan như những thứ dành cho Mahalanobis mà tôi đã tham chiếu.
EngrStudent

1
các entry trên trang web kaggle đưa ra một lời giải thích ngắn gọn xinh đẹp của logloss
bdeonovic

Tìm thấy liên kết này: ex Groomic.biz/blog/2015/12/making-sense-logarithmic-loss . Có thể giúp đỡ.
Deolu A 8/11/2016

Câu trả lời:


8

Logloss là logarit của sản phẩm của tất cả các xác suất. Giả sử Alice dự đoán:

  • với xác suất 0,2, John sẽ giết Jack
  • với xác suất 0,001, Mary sẽ cưới John
  • với xác suất 0,01, Bill là một kẻ giết người.

Hóa ra Mary không cưới John, Bill không phải là kẻ giết người, nhưng John đã giết Jack. Sản phẩm của xác suất, theo Alice, là 0,2 * 0,999 * 0,99 = 0,197802

Bob dự đoán:

  • với xác suất 0,5, John sẽ giết Jack
  • với xác suất 0,5, Mary sẽ cưới John
  • với xác suất 0,5, Bill là một kẻ giết người.

Sản phẩm là 0,5 * 0,5 * 0,5 = 0,125.

Alice là người dự đoán tốt hơn Bob.


Tại sao "sản phẩm của tất cả các xác suất" hoạt động? Điều này nghe có vẻ như một người thân của tối đa hóa kỳ vọng.
EngrStudent

3
Bạn có cần một bằng chứng chính thức? Đó là trong "câu trả lời kỹ thuật" được đề cập bởi chủ đề thông minh. Bạn có cần một lý do "bà" không chính thức tại sao không? Bạn nói: giả sử đồng bào này đưa ra dự đoán chính xác. Xác suất mà mọi thứ xảy ra như nó thực sự xảy ra là gì? Đây là sản phẩm của xác suất.
user31264

"Sản phẩm của xác suất" không phải là "bà". log của sản phẩm xác suất là tổng của xác suất log, mà họ sử dụng để tối đa hóa kỳ vọng và gọi "kỳ vọng". Tôi nghĩ rằng nó cũng được mã hóa trong phân kỳ KL. ... Tôi nghĩ trong buổi nói chuyện với bà, bạn có thể nói "" rất có thể "= xác suất tổng thể cao nhất của nhiều sự kiện. Có hai mức" cao nhất ": 1) tối đa hóa xác suất kết hợp hoặc 2) giảm thiểu xác suất kết hợp âm. học tập thích "giảm độ dốc" hoặc giảm thiểu mức độ xấu. Mất log là xác suất âm được tính theo kích thước mẫu và được giảm thiểu.
EngrStudent

Ở đây liên kết họ nói "exp (-loss) là xác suất trung bình của dự đoán chính xác."
EngrStudent

Tôi thích các Giám mục ở đây . Đó là phương trình 4.108 và là hàm lỗi entropy chéo.
EngrStudent
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.