Làm thế nào lớn một bộ đào tạo là cần thiết?


24

Có một phương pháp phổ biến được sử dụng để xác định có bao nhiêu mẫu đào tạo được yêu cầu để đào tạo một bộ phân loại (LDA trong trường hợp này) để có được độ chính xác tổng quát hóa ngưỡng tối thiểu?

Tôi đang hỏi bởi vì tôi muốn giảm thiểu thời gian hiệu chuẩn thường được yêu cầu trong giao diện máy tính.


2
user2030669, @cbeleites trả lời dưới đây là tuyệt vời nhưng như một quy tắc thô sơ: bạn cần ít nhất 6 lần số trường hợp (mẫu) làm tính năng.
BGreene

2
... trong mỗi lớp. Tôi cũng đã thấy các đề xuất 5p và 3p / lớp.
cbeleites hỗ trợ Monica

Câu trả lời:


31

Thuật ngữ tìm kiếm mà bạn đang tìm kiếm là "đường cong học tập", mang lại hiệu suất mô hình (trung bình) là chức năng của cỡ mẫu đào tạo.

Học đường cong phụ thuộc vào rất nhiều thứ, vd

  • phương pháp phân loại
  • độ phức tạp của phân loại
  • các lớp được phân tách tốt như thế nào

. các giả định và lấy mẫu lại dữ liệu đã có của bạn).

Có hai khía cạnh về hiệu suất của bộ phân loại được đào tạo trên cỡ mẫu hữu hạn (như bình thường),n

  • sai lệch, tức là trung bình một bộ phân loại được đào tạo trên mẫu đào tạo kém hơn so với phân loại được đào tạo về trường hợp đào tạo (điều này thường có nghĩa là học đường cong) vàn = nn= =
  • phương sai: một tập huấn đã cho gồm trường hợp có thể dẫn đến hiệu suất mô hình khá khác nhau. Ngay cả với một vài trường hợp, bạn có thể may mắn và có được kết quả tốt. Hoặc bạn gặp xui xẻo và nhận được một phân loại thực sự xấu. Như thường lệ, phương sai này giảm khi kích thước mẫu đào tạo .nn

    n

Một khía cạnh khác mà bạn có thể cần phải tính đến là thường không đủ để đào tạo một trình phân loại tốt, nhưng bạn cũng cần chứng minh rằng trình phân loại là tốt (hoặc đủ tốt). Vì vậy, bạn cần lập kế hoạch kích thước mẫu cần thiết để xác nhận với độ chính xác nhất định. Nếu bạn cần đưa ra những kết quả này như một phần thành công trong số rất nhiều trường hợp thử nghiệm (ví dụ: độ chính xác / độ chính xác / độ nhạy / giá trị dự đoán dương của nhà sản xuất hoặc người tiêu dùng), và nhiệm vụ phân loại cơ bản là khá dễ dàng, điều này có thể cần nhiều trường hợp độc lập hơn là đào tạo một mô hình tốt.

Theo nguyên tắc thông thường, đối với đào tạo, kích thước mẫu thường được thảo luận liên quan đến độ phức tạp của mô hình (số trường hợp: số lượng biến thiên), trong khi giới hạn tuyệt đối về kích thước mẫu thử có thể được đưa ra cho độ chính xác cần thiết của phép đo hiệu suất.

Đây là một bài báo, nơi chúng tôi đã giải thích những điều này chi tiết hơn và cũng thảo luận về cách tạo ra các đường cong học tập:
Beleites, C. và Neugebauer, U. và Bocklitz, T. và Krafft, C. và Popp, J.: Lập kế hoạch cỡ mẫu cho các mô hình phân loại. Hậu môn Chim Acta, 2013, 760, 25-33.
DOI: 10.1016 / j.aca.2012.11.007
bản thảo được chấp nhận trên arXiv: 1211.1323

Đây là "lời trêu ghẹo", cho thấy một vấn đề phân loại dễ dàng (chúng tôi thực sự có một sự phân biệt dễ dàng như thế này trong vấn đề phân loại của chúng tôi, nhưng các lớp khác khó phân biệt hơn nhiều): trêu ghẹo mẫu quy hoạch

Chúng tôi đã không cố gắng ngoại suy thành các cỡ mẫu đào tạo lớn hơn để xác định cần thêm bao nhiêu trường hợp đào tạo, bởi vì kích thước mẫu thử là nút cổ chai của chúng tôi và kích thước mẫu đào tạo lớn hơn sẽ cho phép chúng tôi xây dựng các mô hình phức tạp hơn, vì vậy việc ngoại suy là nghi vấn. Đối với loại tập dữ liệu tôi có, tôi sẽ tiếp cận điều này lặp đi lặp lại, đo lường một loạt các trường hợp mới, cho thấy mức độ cải thiện của mọi thứ, đo lường nhiều trường hợp hơn, v.v.

Điều này có thể khác với bạn, nhưng bài báo chứa tài liệu tham khảo tài liệu cho các bài báo sử dụng phép ngoại suy đến cỡ mẫu cao hơn để ước tính số lượng mẫu cần thiết.


sử dụng sơ đồ chính quy cho LDA của tôi có cho phép tôi làm việc với tập huấn luyện nhỏ hơn không?
Lunat1c

1
@ user2036690, Một mô hình khác biệt hơn (ít tính năng hơn) sẽ cần ít mẫu đào tạo hơn. Một kế hoạch chính quy sẽ không ảnh hưởng đến số lượng mẫu cần thiết, nếu chỉ làm giảm tác động của các tính năng ít quan trọng hơn. Một số loại hợp lý hóa tính năng có thể cho phép tập huấn luyện nhỏ hơn
BGreene

1
Tuy nhiên, lựa chọn tính năng dựa trên dữ liệu cần số lượng mẫu rất lớn vì mỗi so sánh mô hình trên thực tế là một thử nghiệm thống kê. Lựa chọn tính năng bởi kiến ​​thức chuyên môn, tuy nhiên, có thể giúp ngay lập tức. @BGreene: bạn có thể mở rộng lý do tại sao chính quy hóa có thể giúp giảm các yêu cầu kích thước mẫu (ví dụ: xem xét một sườn núi trên ma trận hiệp phương sai điều hòa)? IMHO nó không thể làm điều kỳ diệu, nhưng nó có thể giúp đỡ.
cbeleites hỗ trợ Monica

Chà, không tham gia vào một cuộc thảo luận sử thi, tôi đã đề cập đến công thức chính quy hóa của Friedman hơn là sườn núi hoặc hồi quy bị phạt khác. Nhưng một trong hai cách, các hệ số không bị giảm về 0 như trong Lasso, do đó, chiều không bị ảnh hưởng, do đó sẽ không ảnh hưởng đến kích thước mẫu cần thiết để tránh ma trận đặt ra như bạn đã đề cập ở trên. Xin lỗi nếu điều này có vẻ lan man
BGreene

@BGreene: không lan man, tôi đã hỏi lại. Câu hỏi thú vị là: tổng df / độ phức tạp giảm đi bao nhiêu bằng cách đặt các hệ số về 0 theo cách dựa trên dữ liệu . Dù sao đi nữa, chúng ta đang trôi vào một câu chuyện khác ...
cbeleites ủng hộ Monica

4

Hỏi về kích thước mẫu đào tạo ngụ ý rằng bạn sẽ giữ lại dữ liệu để xác thực mô hình. Đây là một quá trình không ổn định đòi hỏi một kích thước mẫu rất lớn. Xác nhận nội bộ mạnh mẽ với bootstrap thường được ưa thích. Nếu bạn chọn đường dẫn đó, bạn chỉ cần tính một cỡ mẫu. Như @cbeleites đã nói rất hay, đây thường là một đánh giá "sự kiện cho mỗi biến số ứng viên", nhưng bạn cần tối thiểu 96 quan sát để dự đoán chính xác xác suất của kết quả nhị phân ngay cả khi không có tính năng nào được kiểm tra [điều này là để đạt được Biên độ tin cậy 0,95 của sai số 0,1 khi ước tính xác suất cận biên thực tế mà Y = 1].

Điều quan trọng là phải xem xét các quy tắc chấm điểm thích hợp để đánh giá độ chính xác (ví dụ: điểm Brier và khả năng / sai lệch của nhật ký). Cũng đảm bảo rằng bạn thực sự muốn phân loại các quan sát trái ngược với ước tính xác suất thành viên. Cái sau hầu như luôn hữu dụng hơn vì nó cho phép một vùng màu xám.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.