Tôi đang thực hiện một số ước tính mật độ hạt nhân, với tập hợp các điểm có trọng số (nghĩa là, mỗi mẫu có trọng số không cần thiết), theo kích thước N. Ngoài ra, các mẫu này chỉ trong một không gian số liệu (nghĩa là, chúng ta có thể xác định khoảng cách giữa chúng) nhưng không có gì khác. Ví dụ: chúng ta không thể xác định giá trị trung bình của các điểm mẫu, cũng như độ lệch chuẩn, cũng không chia tỷ lệ một biến so với biến khác. Hạt nhân chỉ bị ảnh hưởng bởi khoảng cách này và trọng lượng của từng mẫu:
Trong bối cảnh này, tôi đang cố gắng tìm một ước lượng mạnh mẽ cho băng thông kernel , có thể thay đổi theo không gian và tốt nhất là sẽ tái cấu trúc chính xác trên tập dữ liệu huấn luyện x i . Nếu cần thiết, chúng ta có thể giả định rằng chức năng tương đối trơn tru.
Tôi đã thử sử dụng khoảng cách đến hàng xóm gần nhất thứ nhất hoặc thứ hai nhưng nó cho kết quả khá tệ. Tôi đã thử với tối ưu hóa một lần, nhưng tôi gặp khó khăn khi tìm một biện pháp tốt để tối ưu hóa trong bối cảnh này trong Nd, vì vậy nó tìm thấy các ước tính rất xấu, đặc biệt là cho các mẫu đào tạo. Tôi không thể sử dụng ước tính tham lam dựa trên giả định thông thường vì tôi không thể tính độ lệch chuẩn. Tôi đã tìm thấy các tài liệu tham khảo bằng cách sử dụng ma trận hiệp phương sai để lấy các hạt nhân dị hướng, nhưng một lần nữa, nó sẽ không giữ được trong không gian này ...
Ai đó có một ý tưởng hoặc một tài liệu tham khảo?