Tôi đã có một bộ dữ liệu với định dạng sau.
Có một kết quả nhị phân ung thư / không có ung thư. Mỗi bác sĩ trong bộ dữ liệu đã nhìn thấy mọi bệnh nhân và đưa ra phán quyết độc lập về việc bệnh nhân có bị ung thư hay không. Sau đó, các bác sĩ đưa ra mức độ tin cậy trong số 5 rằng chẩn đoán của họ là chính xác và mức độ tin cậy được hiển thị trong ngoặc đơn.
Tôi đã thử nhiều cách khác nhau để có được dự báo tốt từ bộ dữ liệu này.
Nó hoạt động khá tốt đối với tôi chỉ là trung bình trên các bác sĩ, bỏ qua mức độ tự tin của họ. Trong bảng trên đây sẽ đưa ra các chẩn đoán chính xác cho Bệnh nhân 1 và Bệnh nhân 2, mặc dù có thể nói không chính xác rằng Bệnh nhân 3 bị ung thư, bởi vì đa số các bác sĩ cho rằng Bệnh nhân 3 bị ung thư.
Tôi cũng đã thử một phương pháp trong đó chúng tôi lấy mẫu ngẫu nhiên hai bác sĩ và nếu họ không đồng ý với nhau thì phiếu quyết định sẽ được chọn để bác sĩ tự tin hơn. Phương pháp đó kinh tế ở chỗ chúng tôi không cần tham khảo ý kiến của nhiều bác sĩ, nhưng nó cũng làm tăng tỷ lệ lỗi khá nhiều.
Tôi đã thử một phương pháp liên quan trong đó chúng tôi chọn ngẫu nhiên hai bác sĩ và nếu họ không đồng ý với nhau, chúng tôi sẽ chọn ngẫu nhiên hai người nữa. Nếu một chẩn đoán đi trước ít nhất hai 'phiếu' thì chúng tôi sẽ giải quyết mọi việc có lợi cho chẩn đoán đó. Nếu không, chúng tôi tiếp tục lấy mẫu nhiều bác sĩ. Phương pháp này khá kinh tế và không mắc quá nhiều sai lầm.
Tôi không thể cảm thấy rằng tôi đang thiếu một số cách làm tinh vi hơn. Ví dụ, tôi tự hỏi liệu có cách nào để tôi có thể chia tập dữ liệu thành tập huấn luyện và kiểm tra hay không, và tìm ra cách tối ưu để kết hợp các chẩn đoán, và sau đó xem các trọng số đó thực hiện như thế nào trên tập kiểm tra. Một khả năng là một phương pháp nào đó cho phép tôi làm các bác sĩ thiếu cân, những người tiếp tục mắc lỗi trong tập thử nghiệm, và có lẽ các chẩn đoán tăng cân được thực hiện với độ tin cậy cao (độ tin cậy tương quan với độ chính xác trong bộ dữ liệu này).
Tôi đã có nhiều bộ dữ liệu phù hợp với mô tả chung này, vì vậy kích thước mẫu khác nhau và không phải tất cả các bộ dữ liệu liên quan đến bác sĩ / bệnh nhân. Tuy nhiên, trong bộ dữ liệu cụ thể này có 40 bác sĩ, mỗi người nhìn thấy 108 bệnh nhân.
EDIT: Đây là một liên kết đến một số các trọng số là kết quả của việc đọc của tôi @ trả lời jeremy dặm của.
Kết quả không trọng số là trong cột đầu tiên. Trên thực tế trong tập dữ liệu này, giá trị độ tin cậy tối đa là 4, không phải 5 như tôi đã nói nhầm trước đó. Do đó sau @ phương pháp jeremy dặm của số điểm không trọng số cao nhất bất kỳ bệnh nhân có thể nhận được sẽ là 7. Điều đó sẽ mang ý nghĩa rằng mỗi bác sĩ khẳng định với một mức độ tin cậy của 4 rằng bệnh nhân đó bị ung thư. Điểm không trọng số thấp nhất mà bất kỳ bệnh nhân nào có thể nhận được là 0, điều đó có nghĩa là mọi bác sĩ đều khẳng định với mức độ tin cậy là 4 mà bệnh nhân đó không bị ung thư.
Trọng số của Cronbach's Alpha. Tôi đã tìm thấy trong SPSS rằng có tổng Cronbach's Alpha là 0,9807. Tôi đã cố gắng xác minh rằng giá trị này là chính xác bằng cách tính toán Cronbach's Alpha theo cách thủ công hơn. Tôi đã tạo ra một ma trận hiệp phương sai của tất cả 40 bác sĩ, mà tôi dán ở đây . Sau đó, dựa trên sự hiểu biết của tôi về công thức Alpha của Cronbach Trong đó là số lượng vật phẩm (ở đây các bác sĩ là 'vật phẩm') tôi đã tính toán bằng cách tổng hợp tất cả các yếu tố đường chéo trong ma trận hiệp phương sai và bằng cách tổng hợp tất cả các yếu tố trong ma trận hiệp phương sai. Sau đó tôi đã nhận Sau đó tôi đã tính 40 kết quả Cronbach Alpha khác nhau sẽ xảy ra khi mỗi bác sĩ bị xóa khỏi tập dữ liệu. Tôi đã cân nhắc bất kỳ bác sĩ nào đóng góp tiêu cực cho Cronbach's Alpha ở mức 0. Tôi đã đưa ra trọng số cho các bác sĩ còn lại tỷ lệ thuận với đóng góp tích cực của họ cho Cronbach 'Alpha.
Trọng số theo tương quan tổng số mục. Tôi tính toán tất cả các Tương quan Tổng số Mục, và sau đó cân mỗi bác sĩ tỷ lệ thuận với kích thước tương quan của chúng.
Trọng số theo hệ số hồi quy.
Một điều tôi vẫn không chắc chắn là làm thế nào để nói phương pháp nào hoạt động "tốt hơn" so với phương pháp khác. Trước đây tôi đã tính toán những thứ như Điểm kỹ năng Peirce, phù hợp với các trường hợp có dự đoán nhị phân và kết quả nhị phân. Tuy nhiên, bây giờ tôi có các dự báo từ 0 đến 7 thay vì 0 đến 1. Tôi có nên chuyển đổi tất cả các điểm có trọng số> 3.50 thành 1 và tất cả các điểm có trọng số <3.50 thành 0 không?
Cancer (4)
đến dự đoán không có ung thư với độ tin cậy tối đa No Cancer (4)
. Chúng ta không thể nói điều đó No Cancer (3)
và Cancer (2)
giống nhau, nhưng chúng ta có thể nói có một sự liên tục, và điểm giữa trong sự liên tục này là Cancer (1)
và No Cancer (1)
.
No Cancer (3)
làCancer (2)
? Điều đó sẽ đơn giản hóa vấn đề của bạn một chút.