Giải thích xác suất của Splines Smooth Smooth Splines


8

TLDR: Các spline hồi quy tấm mỏng có giải thích xác suất / Bayes không?

Cho các cặp đầu vào-đầu ra , ; Tôi muốn ước tính hàm như sau trong đó là hàm kernel và là một vectơ đặc trưng có kích thước . Các hệ số và có thể được tìm thấy bằng cách giải quyết trong đó các hàng của \ Phi được cho bởi(xi,yi)i=1,...,nf()

f(x)u(x)=ϕ(xi)Tβ+i=1nαik(x,xi),
k(,)ϕ(xi)m<nαiβi
minαRn,βRm1nYΦβKαRn2+λαTKα,
Φϕ(xi)T và, với một số lạm dụng ký hiệu, mục nhập thứ i,j của ma trận hạt nhân Kk(xi,xj) . Điều này mang lại cho
α=λ1(I+λ1K)1(YΦβ)
β={ΦT(I+λ1K)1Φ}1ΦT(I+λ1K)1Y.
Giả sử k(,) là hàm nhân xác định dương, giải pháp này có thể được xem là Công cụ dự đoán tuyến tính tốt nhất cho mô hình Bayes sau:
y | (β,h())  N(ϕ(x)β+h(x),σ2),
h()  GP(0,τk(,)),
β1,
trong đó σ2/τ=λGP biểu thị một quy trình Gaussian. Xem ví dụ https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2665800/

Câu hỏi của tôi là như sau. Giả sử tôi cho k(x,x):=|xx|2ln(|xx|)ϕ(x)T=(1,x) , tức là spline tấm mỏng hồi quy. Bây giờ, k(,) không phải là hàm semidefinite dương và cách giải thích ở trên không hoạt động. Liệu mô hình trên và giải pháp của nó vẫn có một giải thích xác suất như trong trường hợp k(,) là semidefinite dương?


Bạn dường như giả định là trong một không gian ba chiều với hoặc ít nhất là số nguyên là số chẵn. xdd=2d
Yves

Ok, vậy những tác động là gì?
MthQ

2
Đây chỉ là một nhận xét phụ vì trong câu hỏi người ta có thể nghĩ rằng là vô hướng. Nhưng trong trường hợp này, hạt nhân của Duchon có dạng với số nguyên và cho spline làm mịn thông thường. Tôi nghĩ rằng việc giải thích xác suất vẫn gần như không thay đổi nhưng GP không cố định: đó là Hàm ngẫu nhiên nội tại . Đối với spline làm mịn thông thường, điều này hóa ra là một quá trình Wiener tích hợp. xi|xx|2m1mm=2
Yves

1
@ Có vẻ thú vị. Bạn có thể muốn mở rộng nhận xét của mình thành câu trả lời, giải thích thêm một chút chức năng ngẫu nhiên nội tại là gì và thêm ví dụ kinh điển về spline làm mịn. Nếu bạn lo lắng về việc chứng minh rằng hạt nhân TPS tạo ra GP không cố định, có thể một mô phỏng có thể là một sự thỏa hiệp hữu ích, đặc biệt nếu bạn thêm một ước tính không tham số về phương sai của phân phối dự báo sau.
DeltaIV

@DeltaIV. Cảm ơn bạn. Tôi sẽ cố gắng để làm điều đó, không phải là một nhiệm vụ dễ dàng. Tôi khá chắc chắn điều này giữ khi các hàm là các đa thức phù hợp liên quan đến kernel, nhưng điều này có thể không còn đúng với tùy ý như trong bối cảnh GP cổ điển hơn. ϕjϕj
Yves

Câu trả lời:


5

Hãy để mô hình của câu hỏi được viết là trong đó là một GP không quan sát được với chỉ số và là một thuật ngữ tiếng ồn bình thường với phương sai . GP thường được coi là trung tâm, đứng yên và không xác định. Lưu ý rằng thuật ngữ có thể được coi là GP (xác định) với kernel trong đó

(1)Yi=ϕ(xi)β+h(xi)+εi
h(x)xRdεiσ2ϕ(x)βϕ(x)Bϕ(x)Blà một ma trận hiệp phương sai `` có giá trị vô hạn ''. Thật vậy, bằng cách lấy với chúng ta có được các phương trình giải quyết câu hỏi. Điều này thường được đặt tên là khuếch tán trước cho . Một kết quả thích hợp cho chỉ có kết quả khi ma trận có thứ hạng đầy đủ. Vì vậy, mô hình viết cũng như trong đó là GP . Giải thích Bayes tương tự có thể được sử dụng với các hạn chế khi không còn là GP mà là mộtB:=ρIρββΦ
(2)Yi=ζ(xi)+εi
ζ(x)ζ(x)Chức năng ngẫu nhiên nội tại (IRF). Đạo hàm có thể được tìm thấy trong cuốn sách của G. Wahba. Các bài thuyết trình dễ đọc về khái niệm IRF là ví dụ trong cuốn sách của N. Cressie và bài viết của Mardia et al trích dẫn dưới đây. IRF tương tự như các quy trình tích hợp nổi tiếng trong bối cảnh thời gian rời rạc (như ARIMA): IRF được chuyển đổi thành GP cổ điển bằng một loại hoạt động khác biệt.

Đây là hai ví dụ về IRF cho . Đầu tiên, hãy xem xét quá trình Wiener với điều kiện ban đầu thay thế bằng điều kiện ban đầu khuếch tán : là bình thường với phương sai vô hạn. Khi đã biết giá trị , IRF có thể được dự đoán là Wiener GP. Thứ hai, hãy xem xét một quá trình Wiener tích hợp được đưa ra bởi phương trình trong đó là một quá trình Wiener. Để có GP, bây giờ chúng ta cần hai tham số vô hướng: hai giá trị và chod=1ζ(x)ζ(0)=0ζ(0)ζ(x)

d2ζ(x)/dx2=dW(x)/dx
W(x)ζ(x)ζ(x)xxhoặc các giá trị và tại một số được chọn . Chúng ta có thể xem xét rằng hai tham số phụ là cùng một Gaussian với ma trận hiệp phương sai vô hạn . Trong cả hai ví dụ, ngay khi có sẵn một bộ quan sát hữu hạn phù hợp, IRF gần như được đối phó như một GP. Ngoài ra, chúng tôi đã sử dụng toán tử vi phân: và tương ứng. Nullspace là một không gian tuyến tính của các hàm sao cho . Nó chứa hàm hằng ζ(x)dζ(x)/dxx2×2L:=d/dxL:=d2/dx2Fϕ(x)Lϕ=0ϕ1(x)=1trong trường hợp đầu tiên và các hàm và trong trường hợp thứ hai. Lưu ý rằng trong ví dụ đầu tiên là GP cho bất kỳ cố định nào trong ví dụ đầu tiên và tương tự là GP trong trường hợp thứ hai.ϕ1(x)=1ϕ2(x)=xζ(x)ζ(x+δ)δζ(xδ)2ζ(x)+ζ(x+δ)

Đối với thứ nguyên chung , hãy xem xét một không gian tuyến tính của các hàm được xác định trên . Chúng tôi gọi một gia số liên quan đến là tập hợp hữu hạn vị trí và trọng số thực sao cho Hãy coi là nullspace của các ví dụ của chúng tôi. Ví dụ đầu tiên, chúng ta có thể lấy ví dụ với và tùy ý vàdFRdFsxiRdsνi

i=1sνiϕ(xi)=0 for all ϕF.
Fs=2x1x2[1,1] . Đối với ví dụ thứ hai, chúng ta có thể lấy cách đều nhau s và . Định nghĩa của một IRF liên quan đến một không gian chức năng và một hàm mà là có điều kiện tích cực WRT , có nghĩa là giữ ngay khi là một gia tăng wrt . Từ vàs=3xiν=[1,2,1]Fg(x,x)F
i=1sj=1sνiνjg(xi,xj)0
[νi,xi]i=1sFFg(x,x) chúng ta có thể tạo ra một hạt nhân hiệp phương sai do đó là GP như trong Mardia et al. Chúng ta có thể bắt đầu từ một toán tử vi phân tuyến tính và sử dụng nullspace như ; IRF sau đó sẽ có kết nối với phương trình một nhiễu Gaussian.LFLζ=

Tính toán dự đoán của IRF gần giống như trong câu hỏi, với thay thế bằng , nhưng với hiện đang tạo cơ sở cho . Ràng buộc bổ sung phải được thêm vào trong bài toán tối ưu hóa, điều này sẽ cho phép . Chúng tôi vẫn có thể thêm các hàm cơ bản không có trong nếu cần; điều này sẽ có tác dụng thêm GP xác định, giả sử vào IRF k(x,x)g(x,x)ϕi(x)FΦα=0αKα0Fψ(x)γζ(x) trong (2).

Spline tấm mỏng phụ thuộc vào một số nguyên sao cho , khoảng chứa đa thức với mức độ thấp, với kích thước tùy thuộc vào và . Có thể chỉ ra rằng nếu là hàm sau cho rồi định nghĩa một wrt dương có điều kiện . Việc xây dựng liên quan đến một toán tử vi saimm>2dFp(m)mdE(r)r0

E(r):={(1)m+1+d/2r2mdlogrd even,r2mdd odd,
g(x,x):=E(xx)FL. Hóa ra với và , spline tấm mỏng không là gì so với spline hình khối tự nhiên thông thường, liên quan đến ví dụ Wiener tích hợp ở trên, với . Vì vậy, (2) không có gì hơn so với mô hình spline làm mịn thông thường. Khi và , nullspace có thứ nguyên và được tạo bởi các hàm , và .d=1m=2g(x,x)=|xx|3d=2m=2p(m)=31x1x2

Thống kê Cressie N cho dữ liệu không gian . Wiley 1993.

Mardia KV, Kent JT, Goodall CR và Little JA. Kriging và splines với thông tin phái sinh. Biometrika (1996), 83,1, trang 207-221.

Mô hình Spline Wahba G cho dữ liệu quan sát . SIAM 1990.

Wang, Y Làm mịn Splines, Phương pháp và Ứng dụng . Chapman và Hội trường, 2011.


Cảm ơn rất nhiều cho những nỗ lực mà bạn bỏ ra. Vô cùng hữu ích. Tôi có thêm một câu hỏi. Vì vậy, việc thêm các hàm cơ sở bổ sung vào (trên đầu các hàm cơ bản của ) không làm thay đổi cách hiểu của . Tuy nhiên, điều tôi nhận thấy là giải pháp được đưa ra trong câu hỏi của tôi ở trên, luôn thỏa mãn , không chỉ khi . Làm thế nào điều này có thể được giải thích? ϕ()Fζ()αΦα=0ϕ()F
MthQ

Đúng. Trong cả hai trường hợp, có các hàm cơ bản trong phép tính gần đúng của , trong khi chỉ có các quan sát được sử dụng. Vì vậy, chúng ta có một cái gì đó giống như hồi quy thiếu thứ hạng với các hệ số và . Vì phần không bị phạt, nên nó có xu hướng 'hấp thụ' nhiều biến thể của hơn phần mang lại các ràng buộc tuyến tính . Lưu ý rằng không có gì cấm sử dụng một số hàm "kernel shift" là . Nếu chúng ta sử dụng tất cả chúng thì tất cản+pf(x)nβiαjβyαpnxk(x,xi)ϕj(x)αjbằng không, có vẻ hợp lý.
Yves
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.