Tôi đã thấy một lượng tài liệu hợp lý về cách chọn hạt nhân và băng thông khi tính toán ước tính mật độ hạt nhân, nhưng tôi hiện đang quan tâm đến cách cải thiện thời gian cần thiết để đánh giá KDE kết quả ở một số điểm tùy ý.
Trong trường hợp của tôi, tôi đang sử dụng hạt nhân Gaussian đa chiều (2D hoặc 3D) với hiệp phương sai đường chéo (tức là mỗi chiều là độc lập). Băng thông ở mỗi chiều có thể khác nhau và được chọn bằng cách sử dụng các lân cận gần nhất. Tuy nhiên, câu hỏi của tôi có lẽ mở rộng đến các phương pháp lựa chọn băng thông và hạt nhân khác nhau.
Giả sử tôi có điểm dữ liệu và muốn đánh giá KDE kết quả tại điểm lưới N. Việc thực hiện đơn giản liên quan đến việc đánh giá pdf M N nhiều lần thông thường . Đối với mục đích của tôi, M và N đều theo thứ tự hàng ngàn và việc đánh giá đã trở thành nút cổ chai trong mã của tôi.
Tôi không biết liệu có bất kỳ cải tiến nào được chấp nhận chung cho phương pháp cơ bản này hay không. Tôi tìm thấy bài báo này , trong đó tuyên bố sẽ giảm độ phức tạp từ xuống O ( M + N ) . Tuy nhiên, phương pháp này chưa được triển khai trong bất kỳ thư viện R hoặc Python 'tiêu chuẩn' nào mà tôi biết - điều này cho thấy nó chưa được áp dụng rộng rãi?
Cảm ơn cho bất kỳ con trỏ bạn có thể cung cấp.