Ước tính mật độ hạt nhân thích ứng?


12

Bất cứ ai cũng có thể báo cáo về kinh nghiệm của họ với một công cụ ước tính mật độ hạt nhân thích ứng?
(Có nhiều từ đồng nghĩa: thích nghi | biến | biến chiều rộng, KDE | biểu đồ | nội suy ...)

Ước tính mật độ hạt nhân cho biết "chúng tôi thay đổi độ rộng của hạt nhân trong các vùng khác nhau của không gian mẫu. Có hai phương pháp ..." thực tế, nhiều hơn: hàng xóm trong một số bán kính, hàng xóm gần nhất KNN (K thường cố định), cây Kd, multigrid ...
Tất nhiên không có phương pháp đơn lẻ nào có thể làm mọi thứ, nhưng phương pháp thích ứng trông hấp dẫn.
Xem ví dụ hình ảnh đẹp của lưới 2d thích ứng trong phương pháp phần tử hữu hạn .

Tôi muốn nghe những gì đã hoạt động / những gì không hoạt động cho dữ liệu thực, đặc biệt là> = 100k điểm dữ liệu phân tán trong 2d hoặc 3d.

Đã thêm vào ngày 2 tháng 11: đây là một âm mưu của mật độ "cục bộ" (piecewise x ^ 2 * y ^ 2), một ước tính lân cận gần nhất và Gaussian KDE với yếu tố của Scott. Mặc dù một (1) ví dụ không chứng minh được điều gì, nhưng nó cho thấy NN có thể phù hợp với những ngọn đồi sắc nét một cách hợp lý (và, sử dụng cây KD, nhanh trong 2d, 3d ...) văn bản thay thế


Bạn có thể đưa ra nhiều bối cảnh hơn về ý nghĩa của bạn khi "những gì hoạt động" hoặc các mục tiêu cụ thể của dự án của bạn trong tay. Tôi đã sử dụng chúng để hình dung các quá trình điểm không gian nhưng tôi nghi ngờ đó là những gì bạn có trong đầu khi đặt câu hỏi này.
Andy W

Câu trả lời:


7

n450np4p là số thứ nguyên) khi các cài đặt trong đó phương thức nhân biến đổi trở nên cạnh tranh với các chiều rộng cố định (đánh giá từ câu hỏi của bạn, bạn không có trong các cài đặt này).

Trực giác đằng sau những kết quả này là nếu bạn không ở trong các cài đặt rất thưa thớt, thì mật độ cục bộ đơn giản là không đủ thay đổi để đạt được độ lệch để vượt qua sự mất hiệu quả (và do đó, AMISE của hạt nhân có chiều rộng thay đổi tăng so với AMISE của chiều rộng cố định). Ngoài ra, với kích thước mẫu lớn mà bạn có (và kích thước nhỏ), hạt nhân có chiều rộng cố định sẽ rất cục bộ, làm giảm bất kỳ lợi ích tiềm năng nào về độ lệch.


Cảm ơn Kwak. "... cho các biến ngẫu nhiên phân phối Gaussian"; bạn có biết công việc mới hơn cho các bản phân phối "cục bộ" không?
chối

@Denis:> 'Clumpy' =? Tập trung =? Với đuôi hẹp hơn gaussian?
user603

Tôi không phải là chuyên gia, nhưng giống như "sự lộn xộn của dữ liệu" trong bài báo của Lang và cộng sự, "Hiểu biết sâu sắc về thuật toán ước tính mật độ hạt nhân nhanh", 2004, 8p
denis

@Denis:> tôi sẽ nói nó làm cho vấn đề trở nên tồi tệ nhất (tức là nhân NN sẽ hoạt động tốt hơn trên dữ liệu ít bị vón cục hơn). Tôi có một lời giải thích trực quan nhưng nó sẽ không phù hợp ở đây, ngoài ra bạn có thể muốn hỏi điều này trên bảng chính như một câu hỏi riêng (liên kết với câu hỏi này) để có thêm ý kiến.
user603


-1

Loess / lowess về cơ bản là một phương thức KDE có thể thay đổi, với chiều rộng của kernel được đặt theo phương pháp lân cận gần nhất. Tôi thấy rằng nó hoạt động khá tốt, chắc chắn tốt hơn nhiều so với bất kỳ mô hình có chiều rộng cố định nào khi mật độ các điểm dữ liệu thay đổi rõ rệt.

Một điều cần lưu ý với KDE và dữ liệu đa chiều là lời nguyền về chiều. Những thứ khác bằng nhau, có ít điểm hơn trong bán kính đặt khi p ~ 10, so với khi p ~ 2. Đây có thể không phải là vấn đề với bạn nếu bạn chỉ có dữ liệu 3d, nhưng đó là điều cần lưu ý.


3
Loess là một phương thức ĐĂNG KÝ nhân thay đổi. Câu hỏi hỏi về ước tính DENSITY hạt nhân thay đổi.
Rob Hyndman

Rất tiếc, bạn đã đúng. Đọc sai câu hỏi.
Hồng Ooi

@Rob, xin lỗi các câu hỏi ngây thơ của tôi: nếu thay đổi độ rộng hạt nhân là (đôi khi) tốt cho hồi quy cục bộ / làm mịn hạt nhân, tại sao nó lại không tốt cho việc ước tính mật độ? Không phải ước tính mật độ là trường hợp ước tính f () cho f () == mật độ ()?
chối

@Hong Ooi, bạn đã sử dụng bao nhiêu điểm trong Ndim? Cảm ơn
denis

@Denis. Câu hỏi tuyệt vời. Bạn có thể vui lòng thêm nó dưới dạng một câu hỏi thích hợp trên trang web không và chúng tôi sẽ xem câu trả lời nào mọi người có thể đưa ra.
Rob Hyndman
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.