Lợi thế của ước tính mật độ hạt nhân so với ước lượng tham số


10

Có bất kỳ lý do cụ thể nào bạn sẽ chọn ước tính mật độ hạt nhân so với ước tính tham số không? Tôi đã học để phù hợp với phân phối dữ liệu của tôi. Câu hỏi này đã đến với tôi.

Kích thước dữ liệu của tôi tương đối lớn với 7500 điểm dữ liệu. Tự động tuyên bố. Mục tiêu của tôi là phù hợp với nó để phân phối (không tham số hoặc tham số). Và sau đó sử dụng nó để mô phỏng dữ liệu yêu cầu tự động và tính toán VaR hoặc TVaR.

Tôi đã sử dụng nhật ký để chuyển đổi dữ liệu để làm cho nó tương đối bình thường. Tôi đã trang bị nhiều bản phân phối bao gồm bình thường, lognatural, gamma, t, v.v ... Tôi đã sử dụng AIC và loglikehood để xác định sự phù hợp nhất. Nhưng không ai trong số tất cả sự phù hợp này vượt qua thử nghiệm KS (giá trị p cực kỳ nhỏ, với e-10).

Đó là lý do tại sao tôi hỏi trong tình huống nào tôi nên chuyển sang KDE.


Dường như với tôi rằng việc phù hợp với tập dữ liệu lớn để phân phối tham số là khá khó. Ngay cả tôi có thể thấy sự phù hợp là rất tốt trên biểu đồ và qqplot, tôi vẫn nhận được giá trị p rất thấp từ thử nghiệm KS. Nhưng KDE có thực sự giải quyết được vấn đề này không? (Tôi chưa bao giờ thử)
MegaChunk

@MegaChunk AFAIK giá trị p từ kiểm tra KS không có nhiều thông tin, vì phân phối không bao giờ hoàn toàn bình thường và do đó nếu bạn có đủ số điểm dữ liệu, giả thuyết null hầu như luôn bị từ chối.
d_ijk_stra

Câu trả lời:


8

Câu hỏi trả lời là "tại sao bạn mô hình hóa dữ liệu của mình dưới dạng mẫu từ một bản phân phối?" Nếu bạn muốn tìm hiểu điều gì đó về hiện tượng đằng sau dữ liệu của mình, như khi cải thiện lý thuyết khoa học hoặc kiểm tra giả thuyết khoa học, sử dụng công cụ ước tính hạt nhân không tham số không cho bạn biết nhiều hơn chính dữ liệu. Trong khi một mô hình được tham số hóa có thể cho biết rõ hơn nhiều (a) liệu dữ liệu và mô hình có đồng ý hay không và (b) các giá trị có khả năng của các tham số là gì. Tùy thuộc vào mục tiêu của bạn do đó thúc đẩy cách tiếp cận bạn nên thích.


6

Có thể là. Ước tính mật độ hạt nhân là một cách tiếp cận không tham số. Ước lượng tham số đòi hỏi một họ phân phối tham số dựa trên một vài tham số được giả định. Nếu bạn có cơ sở để tin rằng mô hình này hoàn toàn chính xác, đó là thuận lợi để thực hiện suy luận tham số. Mặt khác, có thể dữ liệu không phù hợp với bất kỳ thành viên nào trong gia đình. Trong trường hợp đó, tốt hơn là sử dụng ước tính mật độ hạt nhân vì nó sẽ xây dựng một mật độ phù hợp với dữ liệu. Nó không yêu cầu bất kỳ giả định liên quan đến các gia đình tham số.

Mô tả này có thể hơi quá mức cho rõ ràng. Hãy để tôi đưa ra một ví dụ cụ thể để làm cho cụ thể này. Giả sử họ tham số là phân phối chuẩn được xác định bởi hai tham số chưa biết là trung bình và phương sai. Mỗi phân phối trong gia đình là đối xứng và hình chuông với giá trị trung bình bằng trung bình và chế độ. Bây giờ mẫu của bạn không có vẻ đối xứng và giá trị trung bình mẫu rất khác so với trung bình mẫu. Sau đó, bạn có bằng chứng để nghĩ rằng giả định của bạn là sai. Vì vậy, bạn cần tìm một phép biến đổi để chuyển đổi dữ liệu cho phù hợp với một họ tham số tốt (có thể là bình thường) hoặc tìm một họ tham số thay thế. Nếu các phương pháp tham số thay thế này dường như không hoạt động, phương pháp mật độ hạt nhân là một phương pháp thay thế sẽ hoạt động. Có một vài vấn đề (1) hình dạng của hạt nhân, (2) băng thông hạt nhân xác định mức độ mịn và (3) có thể là cỡ mẫu lớn hơn so với những gì bạn có thể cần cho một họ tham số. Vấn đề 1 đã được chứng minh trong tài liệu là thực tế không quan trọng. Vấn đề 2 rất quan trọng. Vấn đề 3 phụ thuộc vào mức độ lớn của một mẫu bạn có thể đủ khả năng để thu thập. Mặc dù các vấn đề này tồn tại cùng với giả định ngầm định rằng phân phối có mật độ, các giả định này có thể dễ chấp nhận hơn các giả định tham số hạn chế. Vấn đề 3 phụ thuộc vào mức độ lớn của một mẫu bạn có thể đủ khả năng để thu thập. Mặc dù các vấn đề này tồn tại cùng với giả định ngầm định rằng phân phối có mật độ, các giả định này có thể dễ chấp nhận hơn các giả định tham số hạn chế. Vấn đề 3 phụ thuộc vào mức độ lớn của một mẫu bạn có thể đủ khả năng để thu thập. Mặc dù các vấn đề này tồn tại cùng với giả định ngầm định rằng phân phối có mật độ, các giả định này có thể dễ chấp nhận hơn các giả định tham số hạn chế.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.