Đây thực chất là một câu hỏi về toán học, không phải thuật ngữ thống kê, theo như tôi có thể nói.
Dù sao vấn đề là số liệu thống kê không phải là một chức năng khả vi của mẫu, hoặc không phải là n− lần liên tục chức năng khả vi của mẫu.
Nói cách khác, có thể có những nơi mà phản ứng của thống kê đối với các thay đổi trong mẫu không lý tưởng hoặc đột ngột không hấp dẫn (do đó, thuật ngữ 'trơn tru'), theo cách mà các hàm tuyến tính hoặc đa thức của dữ liệu, ví dụ, không bao giờ có thể có.
Các trang Wikipedia về chức năng mượt mà có lẽ là không cần thiết về kỹ thuật tại các điểm, nhưng hy vọng một số các hình ảnh và thảo luận mở rộng có thể cung cấp cho bạn một số trực giác cho những gì có nghĩa là để được gợi lên bởi thuật ngữ 'mượt'.
Nếu một chức năng nhất định là "chức năng khác biệt của các khoảnh khắc mẫu" thì đó có thể là chức năng trơn tru của các khoảnh khắc mẫu, tùy thuộc vào ý nghĩa "trơn tru" nào được sử dụng trong ngữ cảnh đó. Tôi thường thấy "trơn tru" được sử dụng có nghĩa là vô cùng nhiều lần liên tục khác nhau (ví dụ như đa thức hoặc hàm tuyến tính hoặc sin và cosin), nhưng đôi khi thuật ngữ này có thể được sử dụng theo nghĩa ít nghiêm ngặt hơn, như trang Wikipedia đề cập.
Trong mọi trường hợp, bạn chắc chắn đúng rằng nó liên quan đến sự khác biệt - đó là ý tưởng chính.
Ngoài ra, đáng chú ý là tồn tại các chức năng liên tục nhưng không "trơn tru" - ý tưởng là trong khi tính liên tục nói chung là một tính chất đều đặn tốt đẹp, trong nhiều trường hợp, nó vẫn cho phép nhiều hành vi bệnh lý không mong muốn, trong khi hành vi bệnh lý như vậy không thể xảy ra đối với các chức năng trơn tru, bởi vì chúng thậm chí còn đẹp hơn so với các chức năng liên tục.
Ví dụ: Xem xét, ví dụ, công cụ ước tính LASSO với hiệp phương sai trực giao:
β^j=SNλ(β^OLSj)=β^OLSjmax⎧⎩⎨⎪⎪⎪⎪0,1−Nλ∣∣β^OLSj∣∣⎫⎭⎬⎪⎪⎪⎪,
trong đó .β^OLS=(XTX)−1XTy=XTy
Trước tiên, chúng tôi lưu ý rằng là tuyến tính theo tọa độ của và vì là tuyến tính trong và , vì vậy (giả sử rằng hoặc đại diện cho mẫu) tất cả là các hàm hoàn toàn trơn tru và không phải là nguồn gốc của độ không mịn. Thay vào đó, bất kỳ độ không mượt nào đều xuất phát từ hàm tối đa được tìm thấy trong định nghĩa của , vì tôi sẽ cố gắng thuyết phục bạn bên dưới.β^OLSjXyβ^OLSXyXyβ^OLSjmaxβ^j
Chúng tôi sử dụng danh tính (đã thảo luận và chứng minh ở đây ) để viết lại biểu thức trên như sau:max{x,y}=x+y+|x−y|2
β^j==β^OLSj2⎡⎣⎢⎢−⎛⎝⎜⎜Nλ∣∣β^OLSj∣∣−1⎞⎠⎟⎟+∣∣∣∣∣Nλ∣∣β^OLSj∣∣−1∣∣∣∣∣⎤⎦⎥⎥⎧⎩⎨⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪0,β^OLSj⎛⎝⎜⎜1−Nλ∣∣β^OLSj∣∣⎞⎠⎟⎟,when Nλ∣∣β^OLS∣∣≥1when Nλ∣∣β^OLS∣∣≤1
Được viết dưới dạng này, rõ ràng là chúng ta có ít nhất hai nguồn có thể cho hành vi không trơn tru: (1) khi , khiến mẫu số biến mất, (2) và các cusps có thể tại (các) điểm trong đó: vì tất nhiên tại các điểm này là "dán cùng nhau" của hai chức năng khác nhau mà, mặc dù chúng có cùng giá trị tại các điểm màβ^OLSj=0
Nλ∣∣β^OLSj∣∣=1⟺Nλ=∣∣β^OLSj∣∣,
β^j(0 and β^OLSj(1−Nλ∣∣∣β^OLSj∣∣∣))Nλ=∣∣β^OLSj∣∣, có thể không nhất thiết "chơi đẹp" với nhau theo cách mà các công cụ phái sinh bên trái và bên phải đồng ý cho tất cả . Ví dụ cơ bản nhất về chức năng mà điều này không xảy ra làtại giá trị : đạo hàm tay trái đầu tiên của nó là và đạo hàm tay phải đầu tiên của nó là , vì vậy nó không trơn tru ở . Tôi nghi ngờ rằng một hiện tượng tương tự có thể xảy ra đối với hàm tại những điểm mà, khiến không phải là một chức năng trơn tru của các đầu vào của nó.
n|x|x=0−11x=0β^jNλ=∣∣β^OLSj∣∣β^j
Hàm chỉ cần trơn tru đối với các đối số đầu vào của nó để được coi là trơn tru. Có lẽ các đối số đầu vào của nó là chính mẫu hoặc một số hàm của mẫu. Nếu là một hàm của hàm của mẫu, thì người ta có thể bằng thành phần có được một hàm mới mà bỏ qua người trung gian (nghĩa là trả lại cùng một kết quả quan tâm và trực tiếp là một chức năng của mẫu). Theo quy tắc chuỗi, hàm tổng hợp này trơn tru khi và chỉ khi cả hai chức năng vàβ^jgβ^jgβ^j∘gβ^~jβ^~j=β^j∘gβ^jg đều trơn tru.