Có công việc nào kết hợp giữa học máy và các dạng lý thuyết phức tạp kỳ lạ hơn không?


13

Dường như với tôi, các chuyên gia khai thác dữ liệu / học máy đã quen thuộc với P và NP, nhưng hiếm khi nói về một số lớp phức tạp tinh vi hơn (ví dụ NC, BPP hoặc IP) và ý nghĩa của chúng để phân tích dữ liệu hiệu quả. Có bất kỳ khảo sát về công việc làm điều này?


2
Không có khảo sát nào tôi biết, nhưng hãy xem con trỏ này để "học lượng tử" (# 5) từ bài đăng này: blog.computationalcomplexity.org/2012/10/quantum-workshop.html
Suresh Venkat

học máy thường xuyên tấn công các vấn đề rất khó xảy ra bên ngoài NP để tối ưu hóa "toàn cầu" nhưng bên trong NP hoặc ít khó hơn so với tối ưu hóa "cục bộ". do đó, toàn bộ khái niệm về lớp phức tạp trở nên mờ nhạt khi người ta tối ưu hóa cho kết quả "đủ tốt", được đo lường nhiều hơn bằng các phép đo chất lượng phụ thuộc vào ứng dụng và theo nghĩa thực sự là apriori thực sự biết chạy thuật toán ....
vzn

@vzn Với tôi, sự tinh tế đó dường như càng có nhiều lý do để chú ý đến sự phức tạp! Nó có thể cung cấp một số hiểu biết rất thú vị.
Mike Izbicki

chắc chắn có mối liên hệ giữa lý thuyết học tập, độ phức tạp mạch, mật mã. nhưng đây là góc của lý thuyết học tập bị loại bỏ khỏi thực tiễn học máy. nếu bạn quan tâm, tôi có thể đưa ra một số gợi ý
Sasho Nikolov

vâng, một ví dụ khác, các BDD (sơ đồ quyết định nhị phân) đã được sử dụng trong các thuật toán cơ sở dữ liệu / khai thác dữ liệu và có các kết nối mạnh mẽ đến độ phức tạp của mạch. nhưng đối với tôi, toàn bộ câu hỏi có thể là một tiền đề khó khăn vì nhiều máy học là thực dụng & phức tạp của ML ứng dụng thường được nghiên cứu gián tiếp / theo kinh nghiệm thông qua việc phân tích các triển khai thực tế của thuật toán thay vì cố gắng dự đoán về mặt lý thuyết hoặc phân loại nghiêm ngặt.
vzn

Câu trả lời:


3

Có một số khác biệt hoặc khác biệt vốn có của các phương pháp tiếp cận giữa hai lĩnh vực học máy ứng dụng và lý thuyết phức tạp / TCS.

Dưới đây là một hội thảo gần đây về chủ đề tại Trung tâm tính hấp dẫn tính toán, Princeton với rất nhiều video.

Mô tả: Nhiều cách tiếp cận hiện tại trong học máy là heuristic: chúng tôi không thể chứng minh các giới hạn tốt về hiệu suất hoặc thời gian chạy của chúng. Hội thảo nhỏ này sẽ tập trung vào dự án thiết kế các thuật toán và phương pháp tiếp cận mà hiệu suất của chúng có thể được phân tích chặt chẽ. Mục tiêu là nhìn xa hơn các thiết lập nơi giới hạn có thể chứng minh đã tồn tại.

Trong TCS, một lĩnh vực nghiên cứu chính về "học tập" đôi khi có thể gây nhầm lẫn thậm chí còn được gọi là "học máy" được gọi là lý thuyết PAC , viết tắt của Có lẽ là gần đúng. nguồn gốc đầu những năm 1980 của nó có trước nghiên cứu hiện đại hơn nhiều về "học máy". wikipedia gọi nó là một phần của lý thuyết học tính toán trường . PAC thường quan tâm đến kết quả của việc học các công thức boolean được đưa ra các mẫu thống kê của các bản phân phối, v.v. và độ chính xác có thể đạt được của việc học với các thuật toán khác nhau hoặc các mẫu giới hạn. Điều này được nghiên cứu một cách lý thuyết nghiêm ngặt với các lớp liên kết với các lớp phức tạp. Nhưng nó không phải là một trang nghiên cứu & wikipedias ứng dụng về học máy thậm chí không liệt kê nó.


5
"Cuộc gọi wikipedia" ... bạn có thực sự biết gì về chủ đề này không? 1) wiki cho học máy có một phần Lý thuyết liên kết với lý thuyết học tính toán trang 2) công việc lý thuyết học tập của Valiant, Vapnik, Schapire, trong số những người khác, đã có tác động rất lớn đến việc thực hành học máy.
Sasho Nikolov
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.