Các kho lưu trữ dữ liệu y tế công cộng ở Hoa Kỳ đang chuyển sang AGE theo định dạng năm năm gia tăng do tác động của các quy định của HIPAA liên quan đến việc cố tình làm mờ và che giấu dữ liệu vì lý do riêng tư cá nhân.
Trước thách thức này với những gì đã có trong quá khứ (trước HIPAA), một yếu tố dữ liệu đo lường ở mức độ khá dựa trên sự khác biệt giữa ngày sinh và ngày chết, chúng ta có thể cần xem xét lại AGE như một biến tỷ lệ có thể được mô tả bằng tham số tất cả trong các bộ dữ liệu y tế công cộng, ủng hộ các mô hình mô tả AGE theo kiểu không tham số, như một mức độ đo lường thông thường. Tôi biết điều này có vẻ "trên đỉnh" đối với nhiều phe phái trong cộng đồng tin học y sinh, nhưng ý tưởng này có thể có một số giá trị về mặt "diễn giải" như được mô tả trong các ý kiến trên.
Điều gì về tất cả các sức mạnh phân tích có sẵn cho các phương pháp không tham số? Đúng, đúng là mọi người trong chúng ta hầu như sẽ cố gắng áp dụng các kỹ thuật GLM (mô hình tuyến tính tổng quát) cho một biến thể hiện chính chúng ta trong các bản phân phối hành xử theo cách AGE làm.
Đồng thời hình dạng của phân phối đó và cách hình dạng đó được xác định bởi các hiệu ứng tương tác đa chiều đối với các khối u đa chiều và các nhóm nhân phụ có trong phân phối, phải được xem xét. Phải làm gì với những tập dữ liệu rất phức tạp này?
Khi một yếu tố dữ liệu không đáp ứng được "các giả định của mô hình", chúng tôi sẽ quét dần dần (tôi đã nói qua, không phải xuống; chúng ta nên sử dụng phương pháp cơ hội bình đẳng, mỗi công cụ xuất phát từ nhà máy có biểu mẫu tuân theo quy tắc chức năng) của các mô hình có thể khác để tìm ra mô hình "không thất bại" các thử nghiệm giả định.
Trong định dạng hiện tại trong các bộ dữ liệu y tế công cộng, chúng tôi thực sự cần (như một cộng đồng trực quan hóa dữ liệu) để đưa ra một mô hình chuẩn hơn để xử lý AGE theo gia số năm năm (5YI). Phiếu bầu của tôi cho trực quan hóa dữ liệu của AGE (được đưa ra định dạng 5YI mới) là sử dụng biểu đồ và biểu đồ hộp và râu. Vâng, điều này có nghĩa là trung bình. (Không có ý định chơi chữ!)
Đôi khi một bức tranh thực sự đáng giá một ngàn từ, và một bản tóm tắt là một bản tóm tắt của một ngàn từ. Biểu đồ hộp và ria cho thấy "hình dạng" của phân phối là một biểu tượng tượng trưng có ý nghĩa của biểu đồ ở mức độ phân giải gần như biểu tượng. So sánh sự phân phối của các mức tăng tuổi năm năm bằng cách hiển thị các ô "cạnh nhau" và các ô râu trong đó người ta có thể so sánh trực quan các mẫu từ 75 đến 50 (trung vị) với các ntiles thứ 25 thấp hơn, sẽ tạo ra một "tiêu chuẩn phổ quát" thanh lịch để so sánh AGE qua thế giới. Đối với những người trong chúng ta tiếp tục tận hưởng cảm giác hồi hộp về biểu diễn dữ liệu thông qua cơ chế văn bản của hiển thị dạng bảng, sơ đồ "thân và lá" cũng có thể được sử dụng khi được sử dụng như một yếu tố đồ họa trực quan hoạt hình trong "tia lửa"
AGE đã đến tuổi. Nó cần được khám phá thêm với các thuật toán tính toán mạnh mẽ hơn hiện có.