Có một băng thông tối ưu cho một công cụ ước tính mật độ hạt nhân của các dẫn xuất không?


14

Tôi cần ước tính hàm mật độ dựa trên một tập hợp các quan sát bằng cách sử dụng công cụ ước tính mật độ hạt nhân. Dựa trên cùng một tập hợp các quan sát, tôi cũng cần ước tính các đạo hàm thứ nhất và thứ hai của mật độ bằng cách sử dụng các đạo hàm của công cụ ước tính mật độ hạt nhân. Băng thông chắc chắn sẽ có ảnh hưởng lớn đến kết quả cuối cùng.

Đầu tiên, tôi biết có một vài hàm R cung cấp băng thông KDE. Tôi không chắc cái nào được ưa thích hơn. Bất cứ ai cũng có thể đề xuất một trong các hàm R này cho băng thông KDE?

Thứ hai, đối với đạo hàm của KDE, tôi có nên chọn cùng một băng thông không?


Đối với mật độ, sự lựa chọn băng thông luôn có phần chủ quan. Đó là một câu hỏi về những gì quá hẹp và do đó gây ra sự thay đổi trong đường cong mà về cơ bản là theo tiếng ồn so với quá rộng nơi đường cong quá trơn tru và bỏ lỡ một số tính năng thực sự trong đường cong. Nhưng bạn ước tính mật độ để tìm ra hình dạng. Vì vậy, làm thế nào để ước tính trơn tru là không dễ dàng để biết. Đối với các công cụ phái sinh tôi sẽ nghĩ nó phụ thuộc vào tính năng của công cụ phái sinh mà bạn muốn biết.
Michael R. Chernick

Câu trả lời:


15

Băng thông tối ưu cho ước tính đạo hàm sẽ khác với băng thông cho ước tính mật độ. Nói chung, mọi tính năng của mật độ đều có bộ chọn băng thông tối ưu riêng.

Nếu mục tiêu của bạn là giảm thiểu lỗi bình phương tích hợp trung bình (là tiêu chí thông thường) thì không có gì chủ quan về nó. Đó là vấn đề lấy được giá trị làm giảm thiểu tiêu chí. Các phương trình được đưa ra trong Phần 2.10 của Hansen (2009) .

Phần khó khăn là băng thông tối ưu là một hàm của chính mật độ, vì vậy giải pháp này không hữu ích trực tiếp. Có một số phương pháp xung quanh để cố gắng giải quyết vấn đề đó. Chúng thường xấp xỉ một số chức năng của mật độ bằng cách sử dụng xấp xỉ bình thường. (Lưu ý, không có giả định rằng chính mật độ là bình thường. Giả định là một số chức năng của mật độ có thể thu được giả định tính quy tắc.)

Trường hợp các giá trị gần đúng được áp đặt sẽ xác định mức độ tốt của bộ chọn băng thông. Cách tiếp cận thô sơ nhất được gọi là "quy tắc tham chiếu bình thường" áp đặt mức gần đúng ở mức cao. Phần cuối của Phần 2.10 trong Hansen (2009) đưa ra công thức sử dụng phương pháp này. Cách tiếp cận này được thực hiện trong hns()chức năng từ ksgói trên CRAN. Đó có lẽ là điều tốt nhất bạn sẽ nhận được nếu bạn không muốn viết mã của riêng mình. Vì vậy, bạn có thể ước tính đạo hàm của mật độ như sau (sử dụng ks):

library(ks)
h <- hns(x,deriv.order=1)
den <- kdde(x, h=h, deriv.order=1)

Một cách tiếp cận tốt hơn, thường được gọi là bộ chọn "cắm trực tiếp", áp đặt xấp xỉ ở mức thấp hơn. Để ước tính mật độ thẳng, đây là phương pháp Sheather-Jones, được thực hiện trong R bằng cách sử dụng density(x,bw="SJ"). Tuy nhiên, tôi không nghĩ rằng có một cơ sở tương tự có sẵn trong bất kỳ gói R nào để ước tính đạo hàm.

Thay vì sử dụng ước lượng nhân thẳng, bạn có thể tốt hơn với công cụ ước lượng đa thức cục bộ. Điều này có thể được thực hiện bằng cách sử dụng locpoly()hàm từ ksgói trong R. Một lần nữa, không có lựa chọn băng thông tối ưu nào được thực hiện, nhưng độ lệch sẽ nhỏ hơn so với các công cụ ước tính kernel. ví dụ,

den2 <- locpoly(x, bandwidth=?, drv=1) # Need to guess a sensible bandwidth

Cảm ơn một triệu, Rob. Tôi có thể sẽ sử dụng băng thông SJ để ước tính mật độ.
dùng13 154

Để ước tính đạo hàm, nếu tôi sử dụng h <- hns (x); den <- kdde (x, h = h, deriv.order = 1), là h băng thông tối ưu được sử dụng để ước tính. Tôi hỏi điều này bởi vì h <- hns (x) được chọn mà không chỉ định thứ tự phái sinh. Cảm ơn.
dùng13 154

Tôi đã kiểm tra công thức được đưa ra ở cuối Phần 2.10 trong Hansen (2009). Có vẻ như băng thông phụ thuộc vào thứ tự đạo hàm, nói đạo hàm rth. h <- hns (x) dường như không phụ thuộc vào r.
dùng13 154

Tôi chỉ phát hiện ra rằng hàm hns có một đối số deriv.order nơi tôi có thể chỉ định thứ tự các đạo hàm. Cảm ơn một lần nữa rất rất nhiều, Rob.
dùng13 154

Lấy làm tiếc. Tôi bỏ nó ra. Bây giờ đã sửa.
Rob Hyndman
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.