Một cách tiếp cận khác (nhiều từ hơn, ít mã hơn) có thể giúp:
Các vị trí của cực đại và cực tiểu địa phương cũng là các vị trí của giao điểm 0 của đạo hàm đầu tiên. Nhìn chung, việc tìm kiếm giao điểm bằng 0 dễ dàng hơn nhiều so với tìm trực tiếp cực đại và cực tiểu cục bộ.
Thật không may, đạo hàm đầu tiên có xu hướng "khuếch đại" nhiễu, vì vậy khi có nhiễu đáng kể trong dữ liệu gốc, đạo hàm đầu tiên chỉ được sử dụng tốt nhất sau khi dữ liệu gốc đã được áp dụng ở mức độ nào đó.
Vì làm mịn là, theo cách hiểu đơn giản nhất, bộ lọc thông thấp, việc làm mịn thường được thực hiện tốt nhất (tốt, dễ dàng nhất) bằng cách sử dụng hạt nhân chập và "định hình" hạt nhân đó có thể cung cấp một lượng đáng kinh ngạc về khả năng bảo tồn / tăng cường tính năng . Quá trình tìm kiếm một hạt nhân tối ưu có thể được tự động hóa bằng nhiều phương tiện khác nhau, nhưng tốt nhất có thể là lực lượng vũ phu đơn giản (rất nhanh để tìm ra các hạt nhân nhỏ). Một hạt nhân tốt sẽ (như dự định) sẽ bóp méo dữ liệu gốc, nhưng nó sẽ KHÔNG ảnh hưởng đến vị trí của các đỉnh / thung lũng quan tâm.
May mắn thay, khá thường xuyên một hạt nhân phù hợp có thể được tạo ra thông qua một SWAG đơn giản ("phỏng đoán có giáo dục"). Độ rộng của nhân làm mịn phải rộng hơn một chút so với đỉnh "thú vị" được mong đợi rộng nhất trong dữ liệu gốc và hình dạng của nó sẽ giống với đỉnh đó (một bước sóng đơn tỷ lệ). Đối với các hạt nhân bảo toàn trung bình (bất kỳ bộ lọc làm mịn tốt nào), tổng các phần tử hạt nhân phải chính xác bằng 1,00 và hạt nhân phải đối xứng về tâm của nó (có nghĩa là nó sẽ có số lượng phần tử lẻ.
Với một hạt nhân làm mịn tối ưu (hoặc một số lượng nhỏ các hạt nhân được tối ưu hóa cho các nội dung dữ liệu khác nhau), mức độ làm mịn trở thành một hệ số tỷ lệ cho ("mức tăng" của) hạt nhân chập.
Xác định mức độ làm mịn "chính xác" (tối ưu) (tăng nhân tích chập) thậm chí có thể được tự động hóa: So sánh độ lệch chuẩn của dữ liệu phái sinh đầu tiên với độ lệch chuẩn của dữ liệu được làm mịn. Làm thế nào tỷ lệ của hai độ lệch chuẩn thay đổi với sự thay đổi mức độ làm mịn cam được sử dụng để dự đoán các giá trị làm mịn hiệu quả. Một vài dữ liệu thủ công chạy (đó thực sự là đại diện) nên là tất cả những gì cần thiết.
Tất cả các giải pháp trước đây được đăng ở trên đều tính đạo hàm đầu tiên, nhưng họ không coi đó là một biện pháp thống kê, cũng như các giải pháp trên không cố gắng thực hiện tính năng bảo toàn / tăng cường làm mịn (để giúp các đỉnh tinh tế "vượt lên trên" tiếng ồn).
Cuối cùng, tin xấu: Tìm kiếm các đỉnh "thực" trở thành nỗi đau của hoàng gia khi tiếng ồn cũng có các tính năng trông giống như các đỉnh thực sự (băng thông chồng chéo). Giải pháp phức tạp hơn tiếp theo thường là sử dụng hạt nhân chập dài hơn ("khẩu độ nhân rộng hơn") có tính đến mối quan hệ giữa các đỉnh "thực" liền kề (như tốc độ tối thiểu hoặc tối đa cho sự xuất hiện cực đại) hoặc sử dụng nhiều tích chập vượt qua bằng cách sử dụng các hạt nhân có độ rộng khác nhau (nhưng chỉ khi nó nhanh hơn: đó là một sự thật toán học cơ bản mà các phép tích tuyến tính được thực hiện theo trình tự luôn có thể được kết hợp thành một tổ hợp). Nhưng trước tiên thường dễ dàng hơn nhiều khi tìm thấy một chuỗi các hạt nhân hữu ích (có độ rộng khác nhau) và kết hợp chúng lại với nhau hơn là tìm trực tiếp hạt nhân cuối cùng trong một bước duy nhất.
Hy vọng rằng điều này cung cấp đủ thông tin để cho phép Google (và có lẽ một văn bản thống kê tốt) điền vào các khoảng trống. Tôi thực sự muốn tôi có thời gian để cung cấp một ví dụ hoạt động, hoặc một liên kết đến một ví dụ. Nếu bất cứ ai đi qua một trực tuyến, xin vui lòng gửi nó ở đây!