Định nghĩa splines khối tự nhiên cho hồi quy


15

Tôi đang tìm hiểu về splines từ cuốn sách "Các yếu tố của khai thác dữ liệu thống kê, suy luận và dự đoán" của Hastie et al. Tôi tìm thấy ở trang 145 rằng các khối vuông tự nhiên là tuyến tính vượt ra ngoài các nút thắt biên. Có K hải lý, ξ1,ξ2,...ξK trong splines và sau được đưa ra về một spline như vậy trong cuốn sách.nhập mô tả hình ảnh ở đây

Câu 1: 4 bậc tự do được giải phóng như thế nào? Tôi không có phần này.

Câu 2 : Trong định nghĩa của khi k = K thì d K ( X ) = 0dk(X)k=K . Tác giả đang cố gắng làm gì trong công thức này? Làm thế nào điều này giúp đảm bảo rằng các spline là tuyến tính vượt ra ngoài các nút biên?dK(X)=00

Câu trả lời:


16
  1. Hãy bắt đầu bằng cách xem xét các splines khối thông thường. Chúng là hình khối giữa mỗi cặp nút thắt và khối bên ngoài nút thắt ranh giới. Chúng tôi bắt đầu với 4df cho khối thứ nhất (bên trái của nút biên đầu tiên) và mỗi nút thêm một tham số mới (vì tính liên tục của các khối và dẫn xuất khối và các đạo hàm thứ hai thêm ba ràng buộc, để lại một tham số tự do), tạo ra tổng cộng cho các nút K.K+4K

    Một spline khối tự nhiên là tuyến tính ở cả hai đầu. Điều này ràng buộc các phần hình khối và bậc hai ở đó bằng 0, mỗi phần giảm df bằng 1. Đó là 2 df ở mỗi hai đầu của đường cong, giảm xuống KK+4K .

    Hãy tưởng tượng bạn quyết định bạn có thể dành tổng số bậc tự do ( , giả sử) cho ước tính đường cong không tham số của bạn. Vì áp đặt một spline tự nhiên sử dụng ít hơn 4 bậc tự do so với một spline hình khối thông thường (cho cùng một số nút), với các tham số p đó, bạn có thể có thêm 4 nút thắt (và hơn 4 tham số nữa) để mô hình đường cong giữa các nút thắt .pp

  2. Lưu ý rằng định nghĩa cho là cho k = 1 , 2 , . . . , K - 2 (vì có tất cả các hàm cơ bản K ). Vậy hàm cơ sở cuối cùng trong danh sách đó, N K = d K - 2 - d K - 1 . Vì vậy, k cao nhất cần thiết cho các định nghĩa của d k là cho k = K - . (Đó là, chúng ta không cần phải cố gắng tìm ra một sốNk+2k=1,2,...,K2KNK=dK2dK1kdkk=K1 có thể làm, vì chúng ta không sử dụng nó.)dK


3

2ξ1,ξ2],ξ1[]ξ1,ξ2[]ξ2,+[|Tôi|= =3|Tôi|-1= =2 nút thắt).

Đối với splines khối (phổ biến)

Không có ràng buộc thường xuyên, chúng ta có phương trình:4|Tôi|= =12

1 ( ξ 1X < ξ 2 ) ; 1 ( ξ 1X < ξ 2 ) X ; ξ

1(X<ξ1)  ;  1(X<ξ1)X  ;  1(X<ξ1)X2  ;  1(X<ξ1)X3  ;
1(ξ1X<ξ2)  ;  1(ξ1X<ξ2)X  ;  1(ξ1X<ξ2)X2  ;  1(ξ1X<ξ2)X3  ;
1(ξ2X)  ;  1(ξ2X)X  ;  1(ξ2X)X2  ;  1(ξ2X)X3.

Crr= =2(r+1)×(|I|1)=3×(|I|1)=6 constraints on the linear coefficients.

We end up with 126=6 degree of freedom.

For natural cubic splines

"A natural cubic splines adds additional constraints, namely that function is linear beyond the boundary knots."

Without regularity constraints, we have 4|I|4=124 equations (we have removed 4 equations, 2 each in both boundary regions because they involve quadratic and cubic polynomials):

1(X<ξ1)  ;  1(X<ξ1)X  ;  
1(ξ1X<ξ2)  ;  1(ξ1X<ξ2)X  ;  1(ξ1X<ξ2)X2  ;  1(ξ1X<ξ2)X3  ;
1(ξ2X)  ;  1(ξ2X)X.

The constraints are the same as before, so we still need to add 3×(|I|1)=6 constraints on the linear coefficients.

We end up with 86=2 degree of freedom.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.