Tại sao các mô hình quá trình Gaussian được gọi là không tham số?


26

Tôi la một chut Nhâm lân. Tại sao các quá trình Gaussian được gọi là mô hình không tham số?

Họ giả định rằng các giá trị chức năng, hoặc một tập hợp con của chúng, có Gaussian trước với giá trị trung bình 0 và hàm hiệp phương sai được đưa ra làm hàm kernel. Bản thân các hàm nhân này có một số tham số (ví dụ: siêu đường kính).

Vậy tại sao chúng được gọi là mô hình không tham số?


1
Tôi biết một số định nghĩa về "các quy trình Gaussian", vì vậy không rõ câu hỏi của bạn thực sự đang hỏi về điều gì. Nhưng khi bạn xem xét làm thế nào để làm rõ nó, hãy tự hỏi mình điều này: chính xác làm thế nào bạn sẽ tham số hóa quá trình Gaussian bạn có trong tâm trí? Nếu bạn không thể làm điều đó một cách tự nhiên với số lượng tham số thực hữu hạn, thì nó nên được coi là không tham số.
whuber

@whuber. AFAIK, các tham số chính của các quá trình gaussian là giá trị trung bình và hàm hiệp phương sai. Nhưng khi chúng tôi tiếp tục thêm các điểm dữ liệu, chúng tiếp tục tăng. Vì vậy, nó tiếp tục tăng. Có phải đó là lý do tại sao các quá trình gaussian được gọi là không tham số?
dùng34790

@whuber Nếu tôi có hàng triệu điểm dữ liệu đào tạo, thì GP f ~ N (m, k) của tôi sẽ là phân phối gaussian đa biến triệu chiều. Nó không quá lớn sao? Ý tôi là dữ liệu đào tạo mới xuất hiện ngày càng lớn hơn. Nó không làm phát sinh vấn đề tính toán sao?
dùng34790

1
"Tham số" so với "không tham số" là các thuật ngữ không áp dụng cho các quy trình cụ thể: chúng áp dụng cho toàn bộ họ các quy trình có thể phù hợp với dữ liệu. Mặc dù tôi vẫn không biết bạn đang nghĩ về gia đình nào, nhưng có vẻ như mặc dù số lượng tham số có thể là hữu hạn trong mọi trường hợp, không có giới hạn về số lượng tham số có thể xuất hiện giữa các thành viên trong gia đình : ergo, vấn đề là không tham số.
whuber

Câu trả lời:


20

Tôi sẽ nói trước điều này bằng cách nói rằng không phải lúc nào cũng rõ nghĩa của một từ "không đối xứng" hay "bán định lượng", v.v. Trong các ý kiến, có vẻ như whuber có một định nghĩa chính thức nào đó (có thể giống như chọn một mô hình từ một số gia đình { M θ : θ Θ } nơi Θ là vô hạn chiều), nhưng tôi sẽ được khá thân mật. Một số người có thể lập luận rằng một phương pháp không tham số là một trong đó số lượng tham số hiệu quả mà bạn sử dụng tăng lên cùng với dữ liệu. Tôi nghĩ rằng có một video trên videolectures.net trong đó (tôi nghĩ) Peter Orbanz đưa ra bốn hoặc năm cách khác nhau về cách chúng ta có thể định nghĩa "không đối xứng".Mθ{Mθ:θΘ}Θ

Vì tôi nghĩ tôi biết những gì bạn có trong đầu, vì đơn giản tôi sẽ cho rằng bạn đang nói về việc sử dụng các quy trình Gaussian để hồi quy, theo một cách điển hình: chúng tôi có dữ liệu đào tạo và chúng tôi quan tâm đến việc mô hình hóa trung bình có điều kiện E ( Y | X = x ) : = f ( x ) . Chúng tôi viết Y i = f ( X i )(Yi,Xi),i=1,...,nE(Y|X=x):=f(x) và có lẽ chúng ta rất đậm như để giả định rằng ε i đang IID và thường được phân phối, ε i ~ N ( 0 , σ 2 ) . X i sẽ là một chiều, nhưng mọi thứ đều mang đến kích thước cao hơn.

Yi=f(Xi)+ϵi
ϵiϵiN(0,σ2)Xi

Nếu của chúng ta có thể lấy các giá trị trong một liên tục thì f ( ) có thể được coi là một tham số của kích thước vô hạn (không thể đếm được). Vì vậy, theo nghĩa là chúng ta đang ước tính một tham số có kích thước vô hạn , vấn đề của chúng ta là một tham số không tham số. Đúng là cách tiếp cận Bayes có một số tham số nổi ở đây và đó. Nhưng thực sự, nó được gọi là không định lượng bởi vì chúng ta đang ước tính một cái gì đó có kích thước vô hạn. Các thầy tu GP chúng ta sử dụng gán khối lượng cho mọi vùng lân cận của mọi hàm liên tục, vì vậy chúng có thể ước tính bất kỳ hàm liên tục nào tùy ý.Xif()

Những điều trong hàm hiệp phương sai được đóng một vai trò tương tự như các thông số làm mịn trong ước lượng frequentist thông thường - để các vấn đề không được hoàn toàn vô vọng, chúng ta phải thừa nhận rằng có một số cấu trúc mà chúng ta mong đợi để xem triển lãm. Bayes thực hiện điều này bằng cách sử dụng trước trên không gian của các hàm liên tục dưới dạng một quy trình Gaussian. Từ quan điểm của Bayes, chúng tôi đang mã hóa niềm tin về f bằng cách giả sử f được rút ra từ GP có chức năng hiệp phương sai tương tự. Việc trước có hiệu quả phạt ước tính của f vì quá phức tạp.ffff

Chỉnh sửa cho các vấn đề tính toán

Hầu hết (tất cả?) Những thứ này có trong cuốn sách Quy trình Gaussian của Rasmussen và Williams.

O(N2)O(N3)v(K+σ2I)v=YKO(N3)kO(kN2)K

O(N3)O(kN2)Nmm×mYNmO(m2N)

KK=QQTQn×qqK+σ2IQTQ+σ2I


8

Nói chung, "không đối xứng" trong không đối xứng Bayesian đề cập đến các mô hình có số lượng tham số (tiềm năng) vô hạn. Có rất nhiều hướng dẫn và bài giảng thực sự hay về chủ đề này trên videolectures.net ( như bài này ) cung cấp tổng quan tốt đẹp về lớp mô hình này.

Cụ thể, Quá trình Gaussian (GP) được coi là không theo tỷ lệ vì GP đại diện cho một hàm (tức là một vectơ vô hạn). Khi số lượng điểm dữ liệu tăng ((x, f (x))), số lượng tham số 'của mô hình' (hạn chế hình dạng của hàm). Không giống như một mô hình tham số, trong đó số lượng tham số cố định với kích thước của dữ liệu, trong các mô hình không tham số, số lượng tham số tăng theo số lượng điểm dữ liệu.


Đây chính xác là những gì tôi đã giả định. Vì vậy, giả định của tôi là đúng tôi đoán. Nhưng câu hỏi của tôi là nếu tôi có triệu điểm (dữ liệu quan sát). Sau đó, f của tôi cũng sẽ có hàng triệu chiều. Vì vậy, tôi sẽ không có vấn đề tính toán. Hơn nữa ma trận hiệp phương sai của tôi cũng sẽ có kích thước 1millionx1million. Vậy tôi nên làm gì trong trường hợp này?
dùng34790

@ user34790 có, bạn sẽ có vấn đề tính toán. Những thách thức tính toán là vấn đề khá lớn đối với các bác sĩ gia đình. Rasmussen và Williams có một cuốn sách về GP với toàn bộ chương dành riêng cho việc này, và nếu bạn đủ chăm chỉ, bạn có thể tìm thấy nó trực tuyến miễn phí. Xem bài viết cập nhật của tôi để biết một số chi tiết tối thiểu.
anh chàng

1

Các tham số mà bạn gọi là siêu đường kính không phải là tham số động lực vật lý và do đó tên. Chúng được sử dụng để chỉ tham số hóa chức năng kernel. Để đưa ra một ví dụ, trong nhân Gaussian:

K(xi,xj)=h2exp((xixj)2λ2)

hλ

Vấn đề này cũng được giải quyết trong bài giảng này , nó có thể giúp hiểu rõ hơn.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.