Tôi có nên đưa ra quyết định dựa trên các biện pháp đánh giá trung bình vi mô hoặc trung bình vĩ mô không?


21

Tôi đã chạy xác thực chéo 10 lần trên các thuật toán phân loại nhị phân khác nhau, với cùng một bộ dữ liệu và nhận được cả kết quả trung bình của Micro và Macro. Cần phải đề cập rằng đây là một vấn đề phân loại nhiều nhãn.

Trong trường hợp của tôi, tiêu cực thực sự và tích cực thực sự có trọng số như nhau. Điều đó có nghĩa là dự đoán chính xác các tiêu cực thực sự cũng quan trọng không kém như dự đoán chính xác các tích cực thực sự.

Các biện pháp trung bình vi mô thấp hơn các biện pháp trung bình vĩ mô. Dưới đây là kết quả của Mạng nơ-ron thần kinh và Máy Vector hỗ trợ:

nhập mô tả hình ảnh ở đây

Tôi cũng đã chạy thử nghiệm phân chia tỷ lệ phần trăm trên cùng một tập dữ liệu với một thuật toán khác. Kết quả là:

nhập mô tả hình ảnh ở đây

Tôi muốn so sánh thử nghiệm phân chia tỷ lệ phần trăm với kết quả trung bình vĩ mô, nhưng điều đó có công bằng không? Tôi không tin rằng các kết quả trung bình vĩ mô là sai lệch bởi vì dương tính thực sự và tiêu cực thực sự có trọng số như nhau, nhưng một lần nữa, tôi tự hỏi liệu điều này có giống như so sánh táo với cam không?

CẬP NHẬT

Dựa trên các ý kiến ​​tôi sẽ chỉ ra cách tính trung bình vi mô và vĩ mô.

Tôi có 144 nhãn (giống như các tính năng hoặc thuộc tính) mà tôi muốn dự đoán. Độ chính xác, thu hồi và F-Đo ​​được tính cho mỗi nhãn.

---------------------------------------------------
LABEL1 | LABEL2 | LABEL3 | LABEL4 | .. | LABEL144
---------------------------------------------------
   ?   |    ?   |    ?   |   ?    | .. |     ?
---------------------------------------------------

Xem xét một biện pháp đánh giá nhị phân B (tp, tn, fp, fn) được tính toán dựa trên các giá trị dương (tp), âm tính thực (tn), dương tính giả (fp) và âm tính giả (fn). Trung bình vĩ mô và vi mô của một biện pháp cụ thể có thể được tính như sau:

nhập mô tả hình ảnh ở đây

nhập mô tả hình ảnh ở đây

Sử dụng các công thức này, chúng ta có thể tính trung bình vi mô và vĩ mô như sau:

nhập mô tả hình ảnh ở đây

nhập mô tả hình ảnh ở đây

Vì vậy, các biện pháp trung bình vi mô thêm tất cả tp, fp và fn (cho mỗi nhãn), sau đó đánh giá nhị phân mới được thực hiện. Các biện pháp trung bình vĩ mô thêm tất cả các biện pháp (Chính xác, Thu hồi hoặc F-Đo) và chia cho số lượng nhãn, giống như một mức trung bình.

Bây giờ, câu hỏi là sử dụng cái nào?


Khi bạn hỏi nên sử dụng cái gì, mục đích sử dụng là gì? Lựa chọn giữa hai phương pháp, tóm tắt kết quả, hay cái gì khác?
Sean Easter ngày

1
Mục đích sử dụng là tìm ra mô hình nào là vượt trội nhất và để nói điều gì đó về hiệu suất của nó. Tôi phát hiện ra rằng các phép đo Micro là vượt trội theo: Forman, George và Martin Scholz. "Táo-táo trong các nghiên cứu kiểm chứng chéo: cạm bẫy trong đo lường hiệu suất phân loại." Bản tin khám phá ACM SIGKDD 12.1 (2010): 49-57.
Kenci

@Kenci, tôi tin rằng bạn nên đăng nó như là một câu trả lời cho câu hỏi của riêng bạn và xác nhận nó là anwer đúng. Cảm ơn đã tham khảo!
fnl

Câu trả lời:


27

Nếu bạn nghĩ rằng tất cả các nhãn có kích thước bằng hoặc ít hơn (có cùng số lượng phiên bản), hãy sử dụng bất kỳ.

Nếu bạn nghĩ rằng có các nhãn có nhiều phiên bản hơn các nhãn khác và nếu bạn muốn thiên vị số liệu của mình đối với các nhãn phổ biến nhất, hãy sử dụng micromedia .

Nếu bạn nghĩ rằng có các nhãn có nhiều phiên bản hơn các nhãn khác và nếu bạn muốn thiên vị số liệu của mình đối với các nhãn ít dân cư nhất (hoặc ít nhất bạn không muốn thiên vị đối với các số đông nhất), hãy sử dụng macromedia .

Nếu kết quả micromedia thấp hơn đáng kể so với macromedia, điều đó có nghĩa là bạn có một số phân loại sai trong các nhãn đông dân nhất, trong khi các nhãn nhỏ hơn của bạn có thể được phân loại chính xác. Nếu kết quả macromedia thấp hơn đáng kể so với micromedia, điều đó có nghĩa là các nhãn nhỏ hơn của bạn được phân loại kém, trong khi các nhãn lớn hơn của bạn có thể được phân loại chính xác.

Nếu bạn không chắc chắn phải làm gì, hãy tiếp tục so sánh trên cả phạm vi vi mô và vĩ mô :)

Đây là một bài báo tốt về chủ đề này.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.