Điều chỉnh các biến số trong phân tích đường cong ROC


20

Câu hỏi này là về việc ước tính điểm số bị cắt trên bảng câu hỏi sàng lọc đa chiều để dự đoán điểm cuối nhị phân, với sự có mặt của các thang đo tương quan.

Tôi đã được hỏi về mối quan tâm của việc kiểm soát các phân nhóm liên quan khi đưa ra các điểm số bị cắt trên mỗi chiều của thang đo (đặc điểm tính cách) có thể được sử dụng để sàng lọc chứng nghiện rượu. Đó là, trong trường hợp cụ thể này, người đó không quan tâm đến việc điều chỉnh các đồng biến bên ngoài (các yếu tố dự đoán) - dẫn đến khu vực (một phần) dưới đường cong ROC được điều chỉnh đồng biến, ví dụ (1-2) - nhưng về cơ bản là các điểm số khác từ cùng một bảng câu hỏi vì chúng tương quan với nhau (ví dụ "sự bốc đồng" với "tìm kiếm cảm giác"). Số tiền này để xây dựng một GLM bao gồm ở phía bên trái điểm quan tâm (mà chúng tôi tìm cách cắt) và một điểm khác được tính từ cùng một bảng câu hỏi, trong khi ở phía bên phải kết quả có thể là tình trạng uống rượu.

Để làm rõ (theo yêu cầu @robin), giả sử chúng tôi có điểm, giả sử (ví dụ: lo lắng, bốc đồng, loạn thần kinh, tìm kiếm cảm giác) và chúng tôi muốn tìm giá trị giới (nghĩa là "trường hợp tích cực" nếu , "trường hợp tiêu cực" nếu không) cho mỗi người trong số họ. Chúng tôi thường điều chỉnh các yếu tố rủi ro khác như giới tính hoặc tuổi tác khi đưa ra mức cắt giảm đó (sử dụng phân tích đường cong ROC). Bây giờ, những gì về việc điều chỉnh sự bốc đồng (IMP) về giới tính, tuổi tác và tìm kiếm cảm giác (SS) vì SS được biết là có tương quan với IMP? Nói cách khác, chúng ta sẽ có một giá trị giới hạn cho IMP khi loại bỏ ảnh hưởng của tuổi tác, giới tính và mức độ lo lắng.j= =4xjtjxj>tj

Ngoài việc nói rằng việc cắt giảm phải đơn giản nhất có thể, phản hồi của tôi là

Về đồng biến, tôi khuyên bạn nên ước tính AUC có và không cần điều chỉnh, chỉ để xem hiệu suất dự đoán có tăng hay không. Ở đây, các đồng biến của bạn chỉ là các phân nhóm khác được xác định từ cùng một công cụ đo lường và tôi chưa bao giờ phải đối mặt với tình huống như vậy (thông thường, tôi điều chỉnh các yếu tố rủi ro đã biết, như Tuổi hoặc Giới tính). [...] Ngoài ra, vì bạn quan tâm đến các vấn đề tiên lượng (tức là hiệu quả sàng lọc của bảng câu hỏi), bạn cũng có thể quan tâm đến việc ước tính giá trị tiên đoán dương tính (PPV, xác suất bệnh nhân có kết quả xét nghiệm dương tính được phân loại chính xác) được cung cấp bạn có thể phân loại các chủ đề là "tích cực" hoặc "tiêu cực" tùy thuộc vào các phân nhóm của chúng trong bảng câu hỏi của bạn. Lưu ý, tuy nhiên,

Bạn có hiểu biết kỹ hơn về tình huống cụ thể này, với liên kết đến các giấy tờ liên quan khi có thể?

Tài liệu tham khảo

  1. Janes, H và Pepe, MS (2008). Điều chỉnh các đồng biến trong các nghiên cứu về chẩn đoán, sàng lọc hoặc đánh dấu tiên lượng: Một khái niệm cũ trong bối cảnh mới . Tạp chí Dịch tễ học Hoa Kỳ , 168 (1): 89-97.
  2. Janes, H và Pepe, MS (2008). Chứa các đồng biến trong phân tích ROC . Sê-ri Giấy làm việc sinh học UW , Giấy 322.

Tôi không phải là một chuyên gia nhưng tôi thấy câu "kiểm soát các phân nhóm liên quan khi đưa ra các điểm số bị cắt trên mỗi chiều của thang đo" một chút bí truyền. Bạn có thể cho tôi thêm một dòng giải thích (nếu không tôi thấy khó hiểu câu hỏi)?
cướp girard

@robin Vâng, về cơ bản, ý tôi là: chúng tôi có điểm (ví dụ: lo lắng, bốc đồng, loạn thần kinh, tìm kiếm cảm giác) và chúng tôi muốn tìm một giá trị giới hạn t j (nghĩa là "trường hợp tích cực" nếu x j > t j , "trường hợp tiêu cực" khác) cho mỗi người trong số họ. Chúng tôi thường điều chỉnh các yếu tố rủi ro khác như giới tính hoặc tuổi tác khi đưa ra mức cắt giảm đó (sử dụng phân tích đường cong ROC). Bây giờ, những gì về việc điều chỉnh sự bốc đồng (IMP) về giới tính, tuổi tác tìm kiếm cảm giác (SS) vì SS được biết là có tương quan với IMP? Nói cách khác, chúng ta sẽ có một giá trị giới hạn cho IMP khi loại bỏ ảnh hưởng của tuổi tác, giới tính và mức độ lo lắng. j= =4tjxj>tj
chl

Nếu mục tiêu cuối cùng là dự đoán một giá trị nhị phân, đưa ra các câu trả lời [tương quan] cho các câu hỏi khảo sát, thì điều này nghe có vẻ giống như một vấn đề phân loại nhị phân tiêu chuẩn. Nó sẽ thích hợp để nghĩ về nó theo cách này? Hoặc là rất quan trọng để đưa ra "giá trị ngưỡng" (mà tôi không biết gì về nó)?
DavidR

@DavidR Vâng, ý tưởng là quyết định giá trị giới hạn (đọc, "chủ đề có nguy cơ cao hơn một giá trị nhất định"), đi kèm với rất nhiều cảnh báo từ góc độ thống kê nhưng hầu hết các bác sĩ lâm sàng đều quen hoặc thích làm việc cách này. (Xin lỗi về việc không nhận thấy bình luận của bạn sớm hơn!)
chl

Câu trả lời:


7

Cách mà bạn đã hình dung về phân tích thực sự không phải là cách tôi khuyên bạn nên bắt đầu nghĩ về nó. Trước hết, thật dễ dàng để chỉ ra rằng nếu phải sử dụng các điểm cắt, thì các điểm cắt không được áp dụng cho các tính năng riêng lẻ mà dựa trên xác suất dự đoán chung. Ngưỡng tối ưu cho một hiệp phương sai phụ thuộc vào tất cả các cấp của các hiệp phương sai khác; nó không thể là hằng số Thứ hai, các đường cong ROC không có vai trò trong việc đáp ứng mục tiêu đưa ra quyết định tối ưu cho một đối tượng riêng lẻ .

Để xử lý các thang đo tương quan, có nhiều kỹ thuật giảm dữ liệu có thể giúp ích. Một trong số đó là phân tích dự phòng chính thức, trong đó lần lượt từng dự đoán được dự đoán phi tuyến từ tất cả các dự đoán khác. Điều này được thực hiện trong redunchức năng trong Hmiscgói R. Phân cụm biến, phân tích thành phần chính và phân tích nhân tố là những khả năng khác. Nhưng phần chính của phân tích, theo quan điểm của tôi, nên xây dựng một mô hình xác suất tốt (ví dụ, mô hình logistic nhị phân).


1
+1 cho sự khác biệt quan trọng về quyết định cá nhân và nhóm. Tôi nên đã dự đoán phản hồi của bạn, đưa ra câu trả lời của bạn ở đây hoặc phản hồi khác của bạn trong danh sách gửi thư của medstats . Tôi cũng tìm thấy bài nói chuyện của bạn về các biện pháp trực tiếp về tiện ích chẩn đoán dựa trên các mô hình rủi ro chẩn đoán đặc biệt khai sáng ở khía cạnh này.
chl

Nói về các biện pháp trực tiếp của tiện ích chẩn đoán dựa trên các mô hình rủi ro chẩn đoán hiện có thể tìm thấy ở đây kc.vanderbilt.edu/quant/Seminar/HarrellPftimeMay12.pdf
Epifunky 22/03/2017

3

Quan điểm của bài báo Janes, Pepe về các đường cong ROC được điều chỉnh đồng biến đang cho phép giải thích linh hoạt hơn các giá trị đường cong ROC ước tính. Đây là một phương pháp phân tầng các đường cong ROC giữa các nhóm cụ thể trong dân số quan tâm. Phân tích dương thực sự ước tính (TPF; eq. Độ nhạy) và phân số âm thực (TNF; eq. Độ đặc hiệu) được hiểu là "xác suất của kết quả sàng lọc chính xác với tình trạng bệnh là Y / N giữa các cá nhân có cùng [biến điều chỉnh danh sách]". Nhìn thoáng qua, có vẻ như những gì bạn đang cố gắng làm là cải thiện kiểm tra chẩn đoán của bạn bằng cách kết hợp thêm các điểm đánh dấu vào bảng điều khiển của bạn.

Một nền tảng tốt để hiểu các phương pháp này tốt hơn một chút là đọc về mô hình mối nguy theo tỷ lệ Cox và xem cuốn sách của Pepe về "Đánh giá thống kê các xét nghiệm y tế để phân loại và ...". Bạn sẽ nhận thấy các biện pháp kiểm tra độ tin cậy chia sẻ nhiều đặc tính tương tự với đường cong sinh tồn, coi điểm số được trang bị là thời gian sống sót. Giống như mô hình Cox cho phép phân tầng đường cong sinh tồn, họ đề xuất đưa ra các biện pháp độ tin cậy phân tầng.

Lý do điều này quan trọng với chúng tôi có thể được biện minh trong bối cảnh mô hình hiệu ứng hỗn hợp nhị phân: giả sử bạn quan tâm đến việc dự đoán nguy cơ trở thành người nghiện meth. SES có một hiệu ứng thống trị rõ ràng đến mức này có vẻ ngu ngốc khi đánh giá một xét nghiệm chẩn đoán, có thể dựa trên các hành vi cá nhân, mà không phân tầng bằng cách nào đó. Điều này là do [chỉ cần lăn lộn với điều này], ngay cả khi một người giàu có các triệu chứng hưng cảm và trầm cảm, họ có thể sẽ không bao giờ thử meth. Tuy nhiên, một người nghèo sẽ cho thấy nguy cơ gia tăng lớn hơn nhiều khi có các triệu chứng tâm lý như vậy (và điểm rủi ro cao hơn). Phân tích thô về rủi ro sẽ cho thấy hiệu suất rất kém của mô hình dự đoán của bạn vì sự khác biệt giống nhau ở hai nhóm không đáng tin cậy. Tuy nhiên, nếu bạn phân tầng (giàu so với nghèo),

Điểm điều chỉnh đồng biến là xem xét các nhóm khác nhau đồng nhất do tỷ lệ và tương tác thấp hơn trong mô hình rủi ro giữa các tầng khác biệt.


(+1) Đó là một phản hồi thú vị, cảm ơn bạn rất nhiều. Mối quan tâm chính của tôi tại thời điểm viết bài này là các giá trị ngưỡng sẽ hơi "phụ thuộc lẫn nhau". Nhưng tôi sẽ kiểm tra cuốn sách của Pepe ( trong khi chờ đợi một số tài liệu phát ở đây ).
chl

Có vấn đề với việc sử dụng cùng một dữ liệu để phát triển và đánh giá một bài kiểm tra y tế nhưng việc khắc phục rất dễ dàng. Bạn nên xem xét một số loại xác thực chéo hoặc phân chia dữ liệu thành các tập hợp con "đào tạo" và "xác thực". Đây thường là một cách tiếp cận hợp lệ để phát triển mô hình chẩn đoán / tiên lượng / dự đoán rủi ro.
AdamO
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.