phương pháp lấy mẫu đơn giản cho Công cụ ước tính mật độ hạt nhân


10

Tôi đã phát triển một Công cụ ước tính mật độ hạt nhân đơn giản trong Java, dựa trên vài chục điểm (có thể lên đến một trăm hoặc hơn) và một hàm nhân Gaussian. Việc triển khai mang lại cho tôi bản PDF và CDF phân phối xác suất của tôi tại bất kỳ thời điểm nào.

Bây giờ tôi muốn thực hiện một phương pháp lấy mẫu đơn giản cho KDE này. Tất nhiên, một sự lựa chọn rõ ràng là rút ra từ chính các điểm tạo nên KDE, nhưng tôi muốn có thể truy xuất các điểm hơi khác so với các điểm trong KDE.

Cho đến nay tôi chưa tìm thấy một kỹ thuật lấy mẫu mà tôi có thể dễ dàng thực hiện để giải quyết vấn đề này (mà không phụ thuộc vào các thư viện bên ngoài để tích hợp số hoặc tính toán phức tạp). Có lời khuyên nào không? Tôi không có yêu cầu đặc biệt mạnh mẽ nào về độ chính xác hay hiệu quả, mối quan tâm chính của tôi là có chức năng lấy mẫu hoạt động và có thể dễ dàng thực hiện. Cảm ơn!


4
Đây là chi tiết trong trang 5 của tài liệu này .

cảm ơn, điều đó rất hữu ích Và đơn giản hơn tôi nghĩ ;-)
Pierre Lison

@ user10525 mã được cung cấp không đúng, nó phải là: rnorm(n, sample(dx$x, n, prob = dx$y, replace = TRUE), dx$bw)nơi dxlà đầu ra từ densitychức năng. Đối số probphải được cung cấp bởi vì nếu không, bạn lấy mẫu thống nhất.
Tim

Câu trả lời:


17

Như Procrastinator đã đề cập, có một cách đơn giản để lấy mẫu từ công cụ ước tính mật độ hạt nhân:

  1. Vẽ một điểm từ tập hợp các điểm , ... bao gồm trong KDExix1xn
  2. Khi bạn có điểm , hãy vẽ một giá trị từ kernel được liên kết với điểm. Trong trường hợp này, rút ​​ra từ Gaussian tập trung tại và phương sai (băng thông)xiN(xi,h)xih

(+1) Để chia sẻ giải pháp của bạn.

Là một trong những điểm ban đầu? Nếu vậy, có vẻ như chúng ta thực sự không cần phải xây dựng KDE thực tế. Chỉ cần lấy mẫu từ một trong những điểm ban đầu và có đủ không? xiN(xi,h)
Ram

Đúng vậy, nếu bạn chỉ sử dụng phân phối KDE để lấy mẫu, bạn không cần phải xây dựng PDF một cách rõ ràng: thông tin duy nhất cần thiết cho hoạt động lấy mẫu là tập hợp các điểm và băng thông.
Pierre Lison

chỉ để thêm vào Pierre Lison: Trong bước 2.: Để lấy mẫu từ hạt nhân Gaussian, băng thông h nên được lấy làm độ lệch chuẩn của phân bố Gaussian quanh điểm x_i, không phải là phương sai.

Bạn có muốn lấy mẫu bằng độ lệch chuẩn 1 / h hay không? Như đã viết, x_i càng ít có khả năng, bạn càng có khả năng lấy mẫu một điểm không chắc chắn khác gần đó vì độ lệch chuẩn của N thấp.
Chris Anderson
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.