Phương pháp tốt nhất để tạo biểu đồ tăng trưởng


10

Tôi phải tạo các biểu đồ (tương tự như biểu đồ tăng trưởng) cho trẻ em từ 5 đến 15 tuổi (chỉ 5,6,7, v.v., không có giá trị phân số như 2,6 năm) cho một biến sức khỏe không âm, liên tục và trong phạm vi 50-150 (chỉ có một vài giá trị ngoài phạm vi này). Tôi phải tạo các đường cong phân vị thứ 90, 95 và 99 và cũng tạo các bảng cho các phân vị này. Cỡ mẫu khoảng 8000.

Tôi đã kiểm tra và tìm thấy những cách có thể sau đây:

  1. Tìm các lượng tử và sau đó sử dụng phương pháp hoàng thổ để có được đường cong trơn tru từ các lượng tử này. Mức độ mịn có thể được điều chỉnh bằng tham số 'span'.

  2. Sử dụng phương pháp LMS (Lambda-Mu-Sigma) (ví dụ: sử dụng các gói gamlss hoặc VGAM trong R).

  3. Sử dụng hồi quy lượng tử.

  4. Sử dụng giá trị trung bình và SD của từng nhóm tuổi để ước tính tỷ lệ phần trăm cho độ tuổi đó và tạo các đường cong tỷ lệ phần trăm.

Cách tốt nhất để làm điều đó là gì? "Tốt nhất" tôi có nghĩa là phương pháp lý tưởng là phương pháp tiêu chuẩn để tạo ra các đường cong tăng trưởng như vậy và sẽ được tất cả mọi người chấp nhận. Hoặc một phương pháp dễ thực hiện và đơn giản hơn, có thể có một số hạn chế, nhưng là một phương pháp nhanh hơn, chấp nhận được. (Ví dụ: sử dụng hoàng thổ trên các giá trị phần trăm nhanh hơn nhiều so với sử dụng LMS của gói gamlss).

Ngoài ra những gì sẽ là mã R cơ bản cho phương pháp đó.

Cảm ơn bạn đã giúp đỡ.


2
Bạn đang yêu cầu "tốt nhất" thường là bất cứ nơi nào giữa khó khăn và không thể thảo luận dứt khoát. .
Nick Cox

Tôi hoan nghênh nỗ lực này, nhưng a) rõ ràng là không tồn tại, khác tại sao lại có giải pháp cạnh tranh, hoặc tại sao điều này không rõ ràng trong tài liệu bạn đang đọc? Quan tâm đến vấn đề này chắc chắn là hàng thập kỷ nếu không phải là hàng thế kỷ. Phương tiện dễ dàng hơn: dễ hiểu hơn, dễ giải thích hơn đối với các chuyên gia hoặc các chuyên gia có đầu óc thống kê nói chung, dễ thực hiện hơn, ...? Tôi không nghi ngờ gì có vẻ kén chọn, nhưng tại sao bạn nên quan tâm đến tốc độ ở đây? Không có phương pháp nào trong số này là đòi hỏi tính toán.
Nick Cox

@NickCox: Tôi đã chỉnh sửa câu hỏi theo ý kiến ​​của bạn. Tôi sẽ đánh giá cao một câu trả lời thực sự.
rnso

1
Xin lỗi, nhưng tôi không làm việc trong lĩnh vực này và tôi nghĩ rằng câu hỏi của bạn quá khó để trả lời. Nhận xét tồn tại bởi vì mọi người có thể không thể hoặc không muốn trả lời nhưng tuy nhiên có điều gì đó để nói. Tôi không viết câu trả lời để đặt hàng.
Nick Cox

Câu trả lời:


6

Có một tài liệu lớn về các đường cong tăng trưởng. Trong tâm trí tôi có ba cách tiếp cận "hàng đầu". Trong cả ba, thời gian được mô hình hóa như một spline hình khối bị hạn chế với số lượng nút thắt đủ (ví dụ: 6). Đây là một tham số mượt mà hơn với hiệu suất tuyệt vời và giải thích dễ dàng.

  1. Các mô hình đường cong tăng trưởng cổ điển (bình phương tối thiểu tổng quát) cho dữ liệu theo chiều dọc với mẫu tương quan hợp lý như AR1 thời gian liên tục. Nếu bạn có thể chỉ ra rằng phần dư là Gaussian, bạn có thể lấy MLE của các lượng tử bằng cách sử dụng các phương tiện ước tính và độ lệch chuẩn chung.
  2. n
  3. YY

Khi bạn đã sử dụng tỷ lệ cược theo tỷ lệ, làm thế nào bạn chấp nhận giả định PO (giả sử nó thất bại) với rất nhiều cấp độ của kết quả? Cảm ơn.
julieth

2
Ngay cả khi nó không thành công, mô hình có thể hoạt động tốt hơn so với một số mô hình khác do có ít giả định hơn về tổng thể. Hoặc chuyển sang một trong các mô hình thứ tự xác suất gia đình xác suất tích lũy khác, chẳng hạn như các mối nguy theo tỷ lệ (liên kết tích lũy log-log.).
Frank Harrell

1

Hồi quy quá trình Gaussian . Bắt đầu với hạt nhân hàm mũ bình phương và thử và điều chỉnh các tham số bằng mắt. Sau đó, nếu bạn muốn làm mọi thứ đúng cách, hãy thử nghiệm với các hạt nhân khác nhau và sử dụng khả năng cận biên để tối ưu hóa các tham số.

Nếu bạn muốn biết thêm chi tiết hơn hướng dẫn được liên kết ở trên cung cấp, cuốn sách này rất hay .


Cảm ơn câu trả lời của bạn. Làm thế nào để bạn đánh giá hồi quy quá trình Gaussian so với các phương pháp khác được đề cập. Biểu đồ Gaussian thứ hai trên scikit-learn.org/0.11/auto_examples/gaussian_ process / ' xuất hiện rất giống với âm mưu cuối cùng thứ hai trên trang này của LOESS (hồi quy cục bộ): princeofslides.blogspot.in/2011/05/ . LOESS dễ thực hiện hơn nhiều.
rnso

Cá nhân, tôi rất thích GPR cho bất kỳ tập dữ liệu nào đủ nhỏ để cho phép bạn phù hợp với nó. Cũng như "đẹp" hơn từ góc độ lý thuyết, nó linh hoạt hơn, mạnh mẽ hơn và cho đầu ra xác suất được hiệu chỉnh tốt. Đã nói tất cả, nếu dữ liệu của bạn dày đặc và hoạt động tốt, thì khán giả của bạn có thể sẽ không thể nói được sự khác biệt giữa LOESS và GPR trừ khi họ là thống kê.
Andy Jones

3
Tôi không thể thấy rằng câu trả lời này giải quyết các tính năng cụ thể của việc muốn các đường cong phân vị. Câu hỏi rõ ràng là không hỏi cách tốt để làm trơn truy như là một chức năng của x?
Nick Cox

1
@Nick: Lời khuyên dự định của tôi là xây dựng một mô hình dữ liệu của bạn và sau đó sử dụng mô hình để xây dựng các đường cong phân vị (mịn). Bây giờ bạn đã đề cập đến nó, vâng tôi hoàn toàn bỏ lỡ thành phần thứ hai (tức là câu hỏi thực tế).
Andy Jones

1
Sử dụng 1,96đối với việc đưa ra các giới hạn như vậy là một giả định rất mạnh mẽ (dựa trên Định mức) rằng trên thực tế có thể bị vi phạm bởi các đường cong tăng trưởng.
whuber
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.