Bạn đã hỏi:
trong trường hợp là 10 triệu thì hồi quy quy trình Gaussian vẫn hoạt động?
Không phải trong ý nghĩa tiêu chuẩn của việc xây dựng và đảo ngược một ma trận lớn. Bạn có hai tùy chọn: 1) chọn một mô hình khác hoặc 2) thực hiện xấp xỉ.
1) Một số mô hình dựa trên GP có thể được thu nhỏ thành các tập dữ liệu rất lớn, chẳng hạn như máy ủy ban Bayes được liên kết trong câu trả lời ở trên. Tôi thấy cách tiếp cận này khá không thỏa đáng: có những lý do chính đáng để chọn mô hình GP và nếu chúng ta chuyển sang mô hình tính toán hơn, chúng ta có thể không giữ được các thuộc tính của mô hình ban đầu. Ví dụ, phương sai dự đoán của BCM phụ thuộc rất nhiều vào sự phân chia dữ liệu.
2) Cách tiếp cận 'cổ điển' đối với xấp xỉ trong GP là để xấp xỉ ma trận hạt nhân. Có một đánh giá tốt về các loại phương pháp này ở đây: http://www.jmlr.org/ con / volume6 / kiononero-candela05a / rsonero-candela05a.pdf . Trên thực tế, chúng ta thường có thể xem các xấp xỉ ma trận này là xấp xỉ mô hình và gộp chúng lại với bộ máy của ủy ban Bayes: chúng thay đổi mô hình và thật khó hiểu khi những thay đổi đó có thể là bệnh lý. Dưới đây là một siêu đánh giá: https : // Vogue.nips.cc/apers/6477-under Hiểu-probabilistic-spude-gaussian- process-appro xấpations.pdf
Cách tôi ủng hộ để thực hiện xấp xỉ cho các GP lớn là tránh xấp xỉ ma trận hạt nhân hoặc mô hình, và xấp xỉ phân phối sau bằng cách sử dụng suy luận đa dạng. Rất nhiều phép tính trông giống như một xấp xỉ ma trận 'thứ hạng thấp', nhưng có một tính chất rất mong muốn: bạn càng sử dụng tính toán (càng nhiều "xếp hạng" thì càng gần đúng với phép đo sau, như được đo bằng KL phân kỳ.
Những bài viết này là một điểm khởi đầu tốt: http://proceedings.mlr.press/v5/titsias09a/titsias09a.pdf
https://arxiv.org/pdf/1309.6835
Tôi đã viết một bài viết dài hơn về cùng một lập luận ở đây: https://www.prowler.io/blog/spzzy-gps-approximate-the-posterior-not-the-model
Trong thực tế, phép tính gần đúng biến đổi hoạt động thực sự tốt trong rất nhiều trường hợp. Tôi đã sử dụng nó rộng rãi trong các ứng dụng thực tế. Và gần đây hơn đã có một số lý thuyết tuyệt vời để sao lưu lý do tại sao nó nên hoạt động ( https://arxiv.org/abs/1903.03571 ).
Một phích cắm cuối cùng: suy luận đa dạng trong GP được triển khai trong gpflow ( https://github.com/GPflow/GPflow )