Tại sao các bản hòa tấu lại có hiệu quả vô lý


14

Dường như đã trở thành tiên đề rằng một nhóm người học dẫn đến kết quả mô hình tốt nhất có thể - và nó đang trở nên hiếm hơn rất nhiều, ví dụ, đối với các mô hình đơn lẻ để giành chiến thắng trong các cuộc thi như Kaggle. Có một lời giải thích lý thuyết cho lý do tại sao các bản hòa tấu rất hiệu quả?


1
Tôi đoán sẽ là Định lý giới hạn trung tâm nhưng tôi không có lý do nào.

Câu trả lời:


13

Đối với một mô hình cụ thể mà bạn cung cấp dữ liệu, hãy chọn các tính năng, chọn siêu đường kính vvetera. So với thực tế, nó có ba loại sai lầm:

  • Xu hướng (do độ phức tạp của mô hình quá thấp, sai lệch lấy mẫu trong dữ liệu của bạn)
  • Phương sai (do nhiễu trong dữ liệu của bạn, quá nhiều dữ liệu của bạn)
  • Tính ngẫu nhiên của thực tế bạn đang cố gắng dự đoán (hoặc thiếu các tính năng dự đoán trong tập dữ liệu của bạn)

Đảm bảo trung bình ra một số các mô hình. Sai lệch do sai lệch lấy mẫu sẽ không được khắc phục vì những lý do rõ ràng, nó có thể khắc phục một số sai lệch độ phức tạp của mô hình, tuy nhiên các lỗi phương sai được thực hiện rất khác so với các mô hình khác nhau của bạn. Đặc biệt là các mô hình tương quan thấp tạo ra những sai lầm rất khác nhau trong lĩnh vực này, một số mô hình nhất định hoạt động tốt ở một số phần nhất định trong không gian tính năng của bạn. Bằng cách tính trung bình các mô hình này, bạn giảm được phương sai này khá nhiều. Đây là lý do tại sao quần thể tỏa sáng.


6

Câu trả lời được chọn là tuyệt vời, nhưng tôi muốn thêm hai điều:

  1. Nó đã được quan sát thấy rằng trung bình dự đoán của con người đưa ra dự đoán tốt hơn bất kỳ dự đoán cá nhân. Điều này được gọi là sự khôn ngoan của đám đông . Bây giờ, bạn có thể lập luận rằng đó là do một số người có thông tin khác nhau, vì vậy bạn đang lấy trung bình thông tin một cách hiệu quả. Nhưng không, điều này đúng ngay cả đối với các nhiệm vụ như đoán số lượng đậu trong một cái lọ. Tôi đưa ra giả thuyết rằng nó phải làm với một số lý do nêu trên về các mô hình khai thác dữ liệu.
  2. Một số kỹ thuật như phương pháp bỏ học trong các mạng thần kinh (trong mỗi lần lặp trong quá trình đào tạo, bạn chỉ sử dụng một đoạn của mạng thần kinh) cho kết quả tương tự như một nhóm các mạng thần kinh. Lý do là bạn đang buộc các nút thực hiện cùng một công cụ dự đoán hoạt động giống như các nút khác, tạo ra một tập hợp meta một cách hiệu quả. Tôi đang nói điều này để đưa ra quan điểm rằng chúng ta có thể giới thiệu một số lợi thế của các bản hòa tấu trong các mô hình truyền thống.

6

Chắc chắn chiến thắng tại dự đoán vì lý do lý thuyết và thực tế.

Có một lý thuyết cơ bản về dự báo tối ưu, nếu chúng ta muốn dự đoán sự kiện tiếp theo theo trình tự dựa trên kiến ​​thức về các sự kiện trước đó. Dự đoán Solomonoff (Solomonoff 1964) có thể tối ưu hóa theo nhiều nghĩa, bao gồm cả nó sẽ học cách dự đoán chính xác bất kỳ chuỗi tính toán nào chỉ với lượng dữ liệu tối thiểu tuyệt đối., (Hutter, Legg & Vitanyi 2007) Một công cụ dự đoán của Solomon có khả năng tương thích với tất cả các chương trình với dữ liệu hiện có, theo mức độ phức tạp của chương trình Kolmogorov và xác suất mà chương trình gán cho dữ liệu cho đến nay, kết hợp Epicurean (Tu giữ tất cả các lý thuyết) và Ockham (cách thích các lý thuyết đơn giản) trong các khuôn khổ Bayes.

Các đặc tính tối ưu của dự đoán Solomonoff giải thích cho phát hiện mạnh mẽ mà bạn đề cập đến: tính trung bình trên các mô hình, nguồn hoặc chuyên gia cải thiện dự đoán và dự đoán trung bình vượt trội hơn cả dự đoán đơn nhất. Các phương pháp tập hợp khác nhau được thấy trong thực tế có thể được coi là xấp xỉ có thể tính toán được với dự đoán của Solomonoff - và một số như MML (Wallace 2005) khám phá rõ ràng các mối quan hệ, mặc dù hầu hết đều không.

Wallace (2005) lưu ý rằng một công cụ dự đoán của Solomonoff không mang tính phân tích - nó giữ một nhóm mô hình vô hạn - nhưng hầu hết sức mạnh dự đoán chắc chắn rơi vào một nhóm mô hình tương đối nhỏ. Trong một số lĩnh vực, mô hình tốt nhất duy nhất (hoặc gia đình của các mô hình gần như không thể phân biệt được) có thể chiếm một phần lớn sức mạnh dự đoán và vượt trội so với các quần thể chung, nhưng trong các lĩnh vực phức tạp với rất ít lý thuyết, hầu như không một gia đình nào nắm bắt được phần lớn xác suất sau, và do đó, tính trung bình trên các ứng cử viên hợp lý sẽ cải thiện dự đoán. Để giành giải thưởng Netflix, nhóm Bellkor đã pha trộn hơn 450 mô hình (Koren 2009).

Con người thường tìm kiếm một lời giải thích tốt duy nhất: trong các lĩnh vực "lý thuyết cao" như vật lý, những điều này hoạt động tốt. Thật vậy, nếu họ nắm bắt được các động lực nhân quả tiềm ẩn, họ sẽ gần như không thể đánh bại. Nhưng trong trường hợp các lý thuyết có sẵn không phù hợp chặt chẽ với các hiện tượng (giả sử, đề xuất phim hoặc địa chính trị), các mô hình đơn lẻ sẽ hoạt động kém: tất cả đều không hoàn chỉnh, vì vậy không nên thống trị. Do đó, sự nhấn mạnh gần đây về các bản hòa tấu (cho học máy) và Trí tuệ đám đông (cho các chuyên gia) và sự thành công của các chương trình như IARPA ACE và đặc biệt là Dự án Phán xét Tốt (Tetlock & Gardiner 2015).

Người giới thiệu

  • M. Hutter, S. Legg và P. Vitanyi, xác suất thuật toán của thuật toán, xác học giả, tập. 2, 2007, tr. 2572.
  • Y. Koren, Giải pháp BellKor cho Giải thưởng lớn của Netflix, năm 2009.
  • Solomonoff, Ray (tháng 3 năm 1964). "Một lý thuyết chính thức về suy luận quy nạp Phần I" (PDF). Thông tin và kiểm soát 7 (1): 1 trận22. doi: 10.1016 / S0019-9958 (64) 90223-2.
  • Solomonoff, Ray (tháng 6 năm 1964). "Một lý thuyết chính thức về suy luận quy nạp Phần II" (PDF). Thông tin và kiểm soát 7 (2): 224 Công ty. doi: 10.1016 / S0019-9958 (64) 90131-7.
  • PE Tetlock, Chuyên gia đánh giá chính trị: Nó tốt như thế nào? Làm sao chúng ta có thể biết?, Nhà xuất bản Đại học Princeton, 2005.
  • Tetlock, PE, & Người làm vườn, D. (2015). Superforecasting: Nghệ thuật và khoa học dự đoán. New York: Vương miện.
  • CS Wallace, thống kê và suy luận quy nạp theo độ dài tin nhắn tối thiểu, Springer-Verlag, 2005.
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.