Độ tự do là không nguyên trong một số bối cảnh. Thật vậy, trong một vài trường hợp, bạn có thể thiết lập rằng mức độ tự do để phù hợp với dữ liệu cho một số mô hình cụ thể phải nằm giữa một số giá trị và .kk+1
Chúng ta thường nghĩ về mức độ tự do là số lượng tham số miễn phí, nhưng có những tình huống mà các tham số không hoàn toàn miễn phí và sau đó chúng có thể khó đếm. Điều này có thể xảy ra khi làm mịn / thường xuyên, ví dụ.
Các trường hợp của phương pháp hồi quy / nhân trọng số cục bộ, một spline làm mịn là ví dụ của tình huống như vậy - tổng số tham số miễn phí không phải là thứ bạn có thể dễ dàng đếm được bằng cách thêm các yếu tố dự đoán, vì vậy cần có ý tưởng tổng quát hơn về mức độ tự do.
Trong tổng quát Additive Models mà trên đó gam
được dựa một phần, Hastie và Tibshirani (1990) [1] (và thực sự trong nhiều tài liệu tham khảo khác) đối với một số mô hình mà chúng ta có thể viết , mức độ tự do đôi khi được đưa đến là (họ cũng thảo luận về hoặc ). Cách đầu tiên phù hợp với cách tiếp cận thông thường hơn khi cả hai đều hoạt động (ví dụ như hồi quy, trong trường hợp bình thường sẽ là kích thước cột của ), nhưng khi đối xứng và không đối xứng, cả ba đều công thức là như nhau.y^=Aytr(A)tr(AAT)tr(2A−AAT)tr(A)XA
[Tôi không có tài liệu tham khảo này để kiểm tra đủ các chi tiết; một sự thay thế của cùng các tác giả (cộng với Friedman) dễ dàng nắm bắt là Các yếu tố của học thống kê [2]; xem ví dụ phương trình 5.16, định nghĩa mức độ tự do hiệu quả của một spline làm mịn là (theo ký hiệu của tôi)]tr(A)
Nói chung, Ye (1998) [3] đã định nghĩa mức độ tự do tổng quát là , là tổng độ nhạy của các giá trị được trang bị cho các quan sát tương ứng của chúng. Đổi lại, điều này phù hợp với nơi định nghĩa đó hoạt động. Để sử dụng định nghĩa của Ye, bạn chỉ cần có thể tính toán và làm nhiễu dữ liệu theo một số lượng nhỏ (để tính toán bằng số). Điều này làm cho nó được áp dụng rất rộng rãi.∑i∂y^i∂yitr(A)y^∂y^i∂yi
Đối với các mô hình như được trang bị bởi gam
, các biện pháp khác nhau thường không phải là số nguyên.
(Tôi đặc biệt khuyên bạn nên đọc thảo luận của các tài liệu tham khảo về vấn đề này, mặc dù câu chuyện có thể trở nên phức tạp hơn trong một số tình huống. Xem, ví dụ [4])
[1] Hastie, T. và Tibshirani, R. (1990),
Các mô hình phụ gia tổng quát
London: Chapman và Hall.
[2] Hastie, T., Tibshirani, R. và Friedman, J. (2009),
Các yếu tố của học thống kê: Khai thác dữ liệu, suy luận và dự đoán , 2ndEd
Springer-Verlag.
https://statweb.stanford.edu/~tibs/ElemStatLearn/
[3] Ye, J. (1998),
"Về đo lường và sửa chữa ảnh hưởng của khai thác dữ liệu và lựa chọn mô hình"
Tạp chí của Hiệp hội thống kê Mỹ , Tập. 93, số 441, trang 120-131
[4] Janson, L., Fithian, W. và Hastie, T. (2013),
"Mức độ tự do hiệu quả: Một phép ẩn dụ thiếu sót"
https://arxiv.org/abs/1312.7851