Làm cách nào để điều chỉnh một tệp PDF gần đúng (nghĩa là: ước tính mật độ) bằng cách sử dụng khoảnh khắc k (theo kinh nghiệm) đầu tiên?


11

Tôi có một tình huống mà tôi có thể ước tính (lần đầu tiên) khoảnh khắc của tập dữ liệu và muốn sử dụng nó để tạo ước tính của hàm mật độ.k

Tôi đã bắt gặp bản phân phối Pearson , nhưng nhận ra nó chỉ dựa vào 4 khoảnh khắc đầu tiên (với một số hạn chế về sự kết hợp các khoảnh khắc có thể).

Tôi cũng hiểu rằng bất kỳ tập hợp hữu hạn nào là không đủ để "chốt hạ" một phân phối cụ thể, khi không sử dụng nhiều giả định. Tuy nhiên, tôi vẫn muốn có một lớp phân phối tổng quát hơn (ngoài nhóm phân phối Pearson). Nhìn vào câu hỏi khác, tôi không thể tìm thấy một bản phân phối như vậy (xem: ở đây , ở đây , ở đây , ở đây , ở đâyở đây ).

Có một số họ phân phối tổng quát ("đơn giản") có thể được xác định cho bất kỳ tập hợp khoảnh khắc nào không? (có thể là một tập hợp các phép biến đổi có thể có một phân phối chuẩn thông thường và biến đổi nó cho đến khi nó xác nhận với tất cả các tập k khoảnh khắc)kk

k+1

Cảm ơn.

ps: Tôi sẽ rất vui vì một ví dụ mở rộng. Tốt nhất là với một ví dụ mã R.


2
kkE[Xk]=(i)kϕX(k)(0)k

Cảm ơn @StephanKolassa - bất kỳ cơ hội nào cho câu trả lời mở rộng / ví dụ về mã R?
Tal Galili


Gửi @whuber, bạn có thể vui lòng đề xuất một ví dụ về mã R không? (ngoài ra, điều này có phù hợp với câu trả lời của người sói không?)
Tal Galili

Đây là một cách tiếp cận hoàn toàn khác với câu trả lời đó.
whuber

Câu trả lời:


11

Phương pháp 1: Hệ thống Pearson bậc cao

p(x)

dp(x)dx=(a+x)c0+c1x+c2x2p(x)

(a,c0,c1,c2)

c0+c1x+c2x2p(x)

dp(x)dx=(a+x)c0+c1x+c2x2+c3x3p(x)

mang lại giải pháp:

nhập mô tả hình ảnh ở đây

Tôi đã giải quyết điều này để giải trí một thời gian trước (có cùng suy nghĩ với OP): đạo hàm và giải pháp được đưa ra trong Chương 5 của cuốn sách của chúng tôi; nếu quan tâm, tải xuống miễn phí có sẵn ở đây:

http://www.mathstatica.com/book/bookcontents.html

Lưu ý rằng mặc dù gia đình Pearson bậc hai (bậc hai) có thể được biểu thị theo 4 thời điểm đầu tiên, gia đình kiểu Pearson bậc ba (khối) yêu cầu 6 khoảnh khắc đầu tiên.

Phương pháp 2: Mở rộng Gram-Charlier

kth

Khoảnh khắc dân số hay khoảnh khắc mẫu ??

Đối với hệ thống kiểu Pearson: Nếu biết được những khoảnh khắc của dân số, thì việc sử dụng những khoảnh khắc cao hơn sẽ rõ ràng mang lại sự phù hợp tốt hơn. Tuy nhiên, nếu dữ liệu quan sát là một mẫu ngẫu nhiên được rút ra từ dân số, có một sự đánh đổi: đa thức bậc cao ngụ ý rằng các khoảnh khắc bậc cao hơn được yêu cầu và các ước tính về sau có thể không đáng tin cậy (có phương sai cao), trừ khi cỡ mẫu là 'lớn'. Nói cách khác, dữ liệu mẫu đã cho, việc sử dụng các khoảnh khắc cao hơn có thể trở nên 'không ổn định' và tạo ra kết quả kém hơn. Điều tương tự cũng đúng đối với các bản mở rộng Gram-Charlier: thêm một thuật ngữ phụ thực sự có thể mang lại sự phù hợp tồi tệ hơn, vì vậy cần có sự chăm sóc.


Gửi @wolfies - cảm ơn câu trả lời của bạn! Nếu tôi hiểu bạn một cách chính xác, bản mở rộng Gram-Charlier phù hợp hơn với những gì tôi đang tìm kiếm (mặc dù bản phân phối Pearson tổng quát hơn rất thú vị để biết). Tôi đã xem cuốn sách của bạn (chương 5, bắt đầu từ trang 175) và thấy bạn thực sự đưa ra một mô tả chi tiết (cũng đề cập đến cách xử lý các khoảnh khắc ước tính, đó là trường hợp của tôi). Điều duy nhất là tôi không thể sử dụng mã của bạn (vì tôi là người dùng R). Cảm ơn câu trả lời của bạn (và cũng cho cuốn sách của bạn có vẻ ấn tượng và thú vị nói chung)
Tal Galili

2
Chỉ cần tìm một gói R để đối phó với các phương thức khác nhau: cran.us.r-project.org/web/packages/PDQutils/vignettes/ trộm
Tal Galili
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.