Máy học phân loại big-O hoặc độ phức tạp


14

Để đánh giá hiệu suất một thuật toán phân loại mới, tôi đang cố gắng so sánh độ chính xác và độ phức tạp (big-O trong đào tạo và phân loại). Từ Machine Learning: đánh giá tôi nhận được một danh sách phân loại được giám sát đầy đủ, cũng là bảng chính xác giữa các thuật toán và 44 vấn đề kiểm tra từ kho lưu trữ dữ liệu UCI . Tuy nhiên, tôi không thể tìm thấy đánh giá, giấy hoặc trang web có chữ O lớn cho các phân loại phổ biến như:

  • C4.5
  • RIPPER (Tôi nghĩ điều này có thể không thể, nhưng ai biết được)
  • ANN với Tuyên truyền trở lại
  • Naive Bayesian
  • K-NN
  • SVM

Nếu bất cứ ai có bất kỳ biểu hiện nào cho các phân loại này, nó sẽ rất hữu ích, cảm ơn bạn.


2
Bạn có thể quan tâm đến bài viết sau: thekerneltrip.com/machine/learning/ Từ chối trách nhiệm hoàn toàn, đó là blog của tôi :)
RUser4512

Quan tâm để tìm lại các vị trí mà các liên kết chết của câu hỏi chỉ vào?
matt

@ RUser4512 thảo luận blog thực sự tuyệt vời! Bạn đã xem xét thêm sự phức tạp không gian là tốt?
matt

1
@matt Cảm ơn bạn :) vâng, nhưng có lẽ trong một bài viết khác, có rất nhiều điều để nói về điều này là tốt!
RUser4512

Câu trả lời:


11

Đặt = số ví dụ đào tạo, d = chiều của các tính năng và c = số lớp.Ndc

Sau đó, đào tạo có phức tạp:

  1. Naive Bayes là , tất cả những gì cần làm là tính toán tần số của mọi giá trị tính năng d i cho mỗi lớp.O(Nd)di
  2. -NN nằm trong O ( 1 ) (một số người thậm chí nói rằng nó không tồn tại, nhưng độ phức tạp của không gian đào tạo là O ( N d ) vì bạn cần lưu trữ dữ liệu cũng mất thời gian).kO(1)O(Nd)
  3. SVM không gần đúng phi tuyến là hoặc O ( N 3 ) tùy thuộc vào hạt nhân. Bạn có thể giảm O ( N 3 ) xuống O ( N 2.3 ) với một số thủ thuật.O(N2)O(N3)O(N3)O(N2.3)
  4. SVM gần đúng là trong đó R là số lần lặp.O(NR)

Kiểm tra độ phức tạp:

  1. Naive Bayes ở trong vì bạn phải truy xuất các giá trị tính năng d cho mỗi lớp c .O(cd)dc
  2. kO(Nd)

Nguồn: "Máy vectơ lõi: Đào tạo SVM nhanh trên các tập dữ liệu rất lớn" - http://machinelearning.wustl.edu/mlauge/apers_files/TsangKC05.pdf

Xin lỗi tôi không biết về những người khác.


6
O(n2)O(n3)

@MarcClaesen Liên kết không hoạt động nữa và nó không nằm trên máy quay ngược. Đây có phải là cùng một bài báo: leon.bottou.org/publications/pdf/lin-2006.pdf ?
lời nói
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.