Tôi muốn thử nghiệm một số ý tưởng của tôi mà tôi nghĩ là tốt hơn bất cứ điều gì tôi đã thấy. Tôi có thể sai nhưng tôi muốn kiểm tra ý tưởng của mình và xóa tan nghi ngờ của tôi bằng những quan sát chắc chắn hơn.
Những gì tôi đã nghĩ là làm như sau:
- Phân tích xác định một tập hợp các phân phối. Một số trong số này là những thứ dễ dàng như Gaussian, thống nhất hoặc Tophat. Nhưng một số trong số này phải khó khăn và đầy thách thức như phân phối Simpsons.
- Triển khai phần mềm dựa trên các phân phối phân tích đó và sử dụng chúng để tạo một số mẫu.
- Bởi vì các bản phân phối được xác định một cách phân tích, tôi đã định nghĩa lại - biết các tệp PDF thực sự của chúng. Điều đó thật tuyệt.
- Sau đó, tôi sẽ kiểm tra các phương pháp ước tính PDF sau với các mẫu ở trên:
- Các phương pháp ước tính PDF hiện có (như KDE với các loại nhân và băng thông khác nhau).
- Ý tưởng của riêng tôi mà tôi nghĩ là đáng để thử.
- Sau đó, tôi sẽ đo lỗi của các ước tính so với các tệp PDF thực.
- Sau đó, tôi sẽ biết rõ hơn về phương pháp ước tính PDF nào là tốt.
Câu hỏi của tôi là:
- Q1: Có bất kỳ cải thiện so với kế hoạch của tôi ở trên?
- Câu 2: Tôi cảm thấy khó khăn khi phân tích nhiều định dạng PDF thực sự. Đã có một danh sách đầy đủ gồm nhiều tệp PDF thực sự được phân tích với các khó khăn khác nhau (bao gồm cả những bản rất khó) mà tôi có thể sử dụng lại ở đây?