Các tiêu chí phù hợp tối thiểu được đề nghị cho phù hợp với bệnh nhân dựa trên nhân khẩu học đáng tin cậy là gì?


30

Khi kết hợp bệnh nhân dựa trên dữ liệu nhân khẩu học, có bất kỳ khuyến nghị nào về lĩnh vực nào phù hợp để bệnh nhân trở thành "Bệnh nhân giống nhau" không?

Tôi biết các thuật toán sẽ khác nhau đối với các triển khai khác nhau, tôi chỉ tò mò liệu có bất kỳ thực tiễn hay khuyến nghị nào tốt nhất xung quanh quy trình này không.

First Name
Last Name
Date of Birth
SSN
Address
City
State
Zip

v.v?


4
Có lẽ câu trả lời cho câu hỏi này cũng có thể thay đổi tùy thuộc vào quốc gia cụ thể hoặc thậm chí dựa trên các cân nhắc về dân tộc và văn hóa. Ví dụ, tên của một người có thể không phải là một định danh bệnh nhân tốt cho thổ dân Úc (hoặc nên được đặt "trọng lượng" thấp hơn trong trường hợp của họ) vì họ có thể thay đổi tên theo thời gian. Những thổ dân Úc mang cùng tên với một người quá cố đã từ bỏ nó vì họ cho rằng việc mang cùng tên của một người đã chết là rất tệ. Một cái gì đó tương tự xảy ra trong các nền văn hóa khác là tên của người chết là điều cấm kỵ. liên kết

4
Hoặc một ví dụ khác từ một nghiên cứu chưa được công bố: ở những người nhập cư Philippines đến Mỹ, mười tên họ phổ biến nhất chiếm khoảng 6% tổng số người. Ở người nhập cư Việt Nam, họ chiếm ~ 60%. Tên là một định danh tốt hơn đáng kể ở người Philippines so với người Việt Nam. Tôi chắc chắn sẽ đăng nghiên cứu đó một khi nó có sẵn.

Chỉ cần làm rõ: là mục tiêu chính để phù hợp với hai bộ hồ sơ?

Khi cố gắng khớp các bản ghi, hãy chắc chắn phân biệt giữa độ mạnh của trận đấu ("Bob" rất giống với "Bob") so với số lượng trận đấu có thể có (có nhiều Bob). Nếu hai bản ghi có cùng tên và không có bản ghi nào khác có tên đó, thì đó có thể là cùng một người ngay cả khi địa chỉ khác nhau. Tất nhiên, giả sử bạn có một khối lượng lớn.
Jon của tất cả các giao dịch

Câu trả lời:


20

bài tiểu luận tuyệt vời này (bằng tiếng Tây Ban Nha, xin lỗi) được viết bởi Pablo Pazos, một Kỹ sư CS từ Uruguay, người đã làm việc về Chăm sóc sức khỏe từ năm 2006 và đã có những đóng góp to lớn cho lĩnh vực này, trong đó ông mô tả một thuật toán để thực hiện điều này.

Bạn có thể chạy bài viết thông qua một dịch giả, nhưng ý chính của nó là thông tin cơ bản để xác định danh tính của một người là họ và họ (cả từ cha và mẹ), giới tính và ngày sinh. Thật thú vị, anh ta đặc biệt loại trừ các số id như SSN khỏi các thuật toán khớp danh tính của mình, vì "bất kỳ loại định danh nào KHÔNG phải là một phần của danh tính của anh ta" (tuy nhiên tôi đoán rằng điểm này có thể gây tranh cãi). Ngoài ra, anh ta loại trừ các thuộc tính như địa chỉ đường phố, số điện thoại, v.v. vì chúng không thực sự liên quan đến danh tính của ai đó, nên chúng không liên quan đến "ai đó thực sự là ai".

Ngoài ra, anh ta gán các "trọng số" khác nhau cho từng thuộc tính trước đây, như thế này:

  • Tên: 17,5%
  • Tên đệm: 17,5%
  • Tên gia đình (cha): 17,5%
  • Tên gia đình (mẹ): 17,5%
  • Giới tính: 10%
  • DOB: 20%

Với các kết quả khớp được tìm thấy trên mỗi một trong các thuộc tính này, ông mô tả một phương pháp để có được một "chỉ số phù hợp phù hợp" tổng hợp mà có thể so sánh giữa các bản ghi. Ngoài ra, có thể khớp "một phần" trên các thuộc tính tên bằng cách sử dụng các thuật toán như khoảng cách của Levenshtein .

Đọc tốt, IMO. Xin lỗi, nó bằng tiếng Tây Ban Nha, nhưng tôi hy vọng tôi có thể truyền đạt ý tưởng chính của nó.


2
Điều này thật tuyệt, cảm ơn. +1 cũng để đề cập đến khoảng cách vì lỗi chính tả khá phổ biến, đặc biệt là trong các cộng đồng có nền văn hóa đa dạng cao như thường thấy ở Bắc Mỹ. Điều đó nói rằng, hầu hết các trường hợp mà tôi phải thực hiện khớp với miền của các giá trị có thể bị hạn chế. Vì vậy, trong những trường hợp này, bất kỳ tiêu chí đáng tin cậy nào (như số bảo hiểm y tế) trả về một lần truy cập duy nhất trong cơ sở dữ liệu là đủ, nếu nhiều mục được trả về, tôi có xu hướng hỏi người dùng (nếu có) hoặc lọc với tiêu chí bổ sung.

(... contd) Lưu ý rằng các trường hợp này áp dụng tốt cho việc cài đặt EMR cục bộ cho phòng khám hoặc bệnh viện hoặc RIS cho khoa radio9logy. Trong những trường hợp này, khách hàng được đăng ký tại phòng khám hoặc bệnh viện hoặc không. Trong trường hợp của Bộ KH & ĐT tuy nhiên đây là một trò chơi bóng hoàn toàn mới.

13

Không có thuật toán ma thuật duy nhất cho bệnh nhân phù hợp, và tôi nghi ngờ sẽ có bao giờ.

Để bắt đầu, có sự khác biệt trong khu vực. Như MMattoli đã chỉ ra, những gì hoạt động tốt trong một bệnh viện ở thành thị của Hoa Kỳ có lẽ sẽ không phù hợp với một phòng khám nông thôn ở Úc điều trị cho thổ dân.

Ngoài ra, các trang web riêng lẻ có quan điểm khác nhau về khả năng chịu lỗi. Nếu bạn chỉ khớp khi bạn hoàn toàn chắc chắn , bạn sẽ nhận được rất nhiều trận đấu bị bỏ lỡ. Điều này gây ra các hồ sơ bệnh nhân trùng lặp, tạo ra một loạt các vấn đề khác. Hầu hết các trang web sẽ sẵn sàng giải quyết cho khá chắc chắn , nhưng làm thế nào chắc chắn là đủ chắc chắn? Hỏi 10 người và bạn sẽ nhận được 12 câu trả lời.

Do đó, thuật toán "tốt nhất" sẽ có thể cấu hình được, vì vậy khách hàng của bạn có thể điều chỉnh nó để phù hợp với nhu cầu của họ.

Khi xem xét một trận đấu, các lĩnh vực khác nhau cung cấp mức độ tự tin khác nhau.

Các định danh dành riêng cho chăm sóc sức khỏe mang lại sự tự tin nhất, vì toàn bộ mục đích của họ là xác định duy nhất người trong hệ thống y tế. Các bệnh viện thường chịu khó để đảm bảo những điều này không bị trùng lặp.

Ví dụ:

  • ID Y tế Quốc gia (ví dụ Số NHS của Vương quốc Anh)
  • Số hồ sơ bệnh án do bệnh viện chỉ định.

Các định danh bệnh nhân khác cũng có thể cung cấp độ tin cậy cao, tùy thuộc vào hệ thống. Ví dụ, ID quân đội có lẽ rất phù hợp trong bệnh viện quân đội.

Ví dụ:

  • ID quân đội
  • ID bảo hiểm
  • Số An sinh Xã hội (Ở Hoa Kỳ, Số An sinh Xã hội thường không được coi là một trận đấu có độ tin cậy cao, do gian lận bảo hiểm tràn lan.)

Trong trường hợp không có định danh duy nhất, người ta phải sử dụng thông tin nhân khẩu học. Không phù hợp để phù hợp với bất kỳ một lĩnh vực nào, nhưng càng phù hợp với lĩnh vực nhân khẩu học, trận đấu càng tự tin.

Những điều về một người không thường xuyên thay đổi là tốt để phù hợp:

  • Tên
  • Giới tính
  • Ngày sinh

Nhưng thậm chí nhiều thông tin dễ uốn hơn có thể được xem xét trong trận đấu để tăng cường sự tự tin:

  • Địa chỉ nhà
  • Số điện thoại
  • Địa chỉ email

3
SSN cũng có một số hạn chế rất nghiêm ngặt, ví dụ ở Canada, việc yêu cầu nó là bất hợp pháp trừ khi bạn là chủ lao động hoặc ngân hàng (có lẽ cũng vậy, tôi không phải là luật sư). Những nơi khác như Trung Quốc, họ sử dụng nó cho hầu hết mọi thứ, thậm chí để mua vé tàu trong những ngày lễ giao thông cao.

Thay đổi tên là phổ biến nếu bạn là nữ. Và hai người thường có cùng tên và thậm chí sống cùng một nơi (ví dụ như cha có một đứa con trai đặt tên cho anh ta).
HLGEM

@HLGEM: Hoàn toàn chính xác, đó là lý do tại sao không có trường nhân khẩu học duy nhất nào được sử dụng để khớp. Nhưng khi mọi người phải dùng đến điều đó, các trường tĩnh hơn (dù sao đôi khi cũng thay đổi) đáng tin cậy hơn so với giải pháp thay thế. Điều đó không làm cho họ tốt, mặc dù.
Lynn

7

Nó cũng đáng để kiểm tra họ trước vì chúng thường thay đổi.


+1 "thường" là một cách đánh giá thấp. :) Đây chắc chắn có thể là trường hợp cho những bệnh nhân không thể nhận dạng hoặc không được đặt tên, trẻ sơ sinh, xác định sai, và như vậy. Tên khó hơn, nhưng quan trọng hơn, trong một môi trường có nhiều giao dịch.

4

Ngoài sự kết hợp rõ ràng của ba điều sau đây trong câu hỏi của bạn

First Name
Last Name
Date of Birth
City
State
ZIP/Pin Code

Tôi sẽ nghĩ đến việc thêm phone number (Home and/or Cell)vào danh sách. Ngày nay nó khá phổ biến và mỗi số sẽ có một số duy nhất và ngay cả khi một số lần mọi người thay đổi số điện thoại, số điện thoại cũ hơn được hầu hết mọi người nhớ đến, vì vậy có thể trở nên tiện dụng.

Chúng tôi thấy địa chỉ thường bị nhiều cách viết và nhiều cách hiển thị, đặc biệt là ở các quốc gia như Ấn Độ nơi mọi người sử dụng ngôn ngữ địa phương và phần mềm quản lý bệnh nhân "vẫn" sử dụng tiếng Anh.


3

Giới tính trong hồ sơ dường như thường được lấy từ Tên. Tôi đã thấy sự chênh lệch giới tính gia tăng đối với người nước ngoài, khi chúng ta không thể lấy được giới tính từ cái tên.

Ở Đức, chúng tôi có một số phương sai khác với các tên chứa 'Umlaute' như 'äöü', đôi khi được thay thế bằng 'ae oe ue'.


1

Suy nghĩ của tôi là theo thứ tự như dưới 1). SSN, Họ và 5 ký tự đầu tiên của tên 2). SSN, ngày sinh và 5 ký tự đầu tiên của tên 3). SSN, ngày sinh và họ 4). SSN, Giới tính, Ngày sinh 5). Họ, 5 ký tự đầu tiên của tên, thành phố và zip


1

Đây là một vấn đề thực sự khó khăn ở Mỹ. Tên không phải là duy nhất và thường thay đổi trong suốt cuộc đời của một người hoặc được trình bày khác nhau (ví dụ Rob so với Robert), vì vậy chúng không bao giờ có thể được sử dụng để nhận dạng bệnh nhân ngoại trừ kết hợp với một số thông tin xác thực hơn. Số bảo hiểm y tế và nhà cung cấp thay đổi thường xuyên hơn nhiều và có thể giống nhau cho nhiều thành viên trong gia đình. SSN được cho là duy nhất, nhưng có sự gian lận xung quanh nó. Tương tự với số liscense của Driver mà tất nhiên không phải ai cũng có.

Cá nhân, tôi sẽ bắt đầu với số hợp đồng bảo hiểm và ngày sinh và kết hợp tên, sau đó là ssn và ngày sinh và kết hợp tên. Tôi sẽ kiểm tra địa chỉ và điện thoại để cung cấp cho tôi sự đảm bảo bổ sung khi chúng khớp nhưng không nặng nếu chúng không có. Ngoài ra, tôi sẽ sử dụng nhóm máu làm yếu tố loại trừ nếu được biết (và tất cả chúng ta đều biết ma cà rồng bệnh viện sẽ lấy mẫu máu) vì điều đó không thay đổi. Khớp tên sẽ phải khớp mờ do vấn đề biến đổi tên. Những thứ khác thường nên tìm kiếm một trận đấu chính xác đầu tiên phù hợp với họ nếu độ tin cậy của tên thực sự cao (có thể là một lỗi đánh máy khi vào SSN).

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.