Thống kê Kappa ( ) được Cohen [1] giới thiệu vào năm 1960 để đo lường sự thỏa thuận giữa hai người. Phương sai của nó, tuy nhiên, đã là một nguồn mâu thuẫn trong một thời gian khá lâu.
Câu hỏi của tôi là về cách tính toán phương sai tốt nhất được sử dụng với các mẫu lớn. Tôi có xu hướng tin rằng cái được thử nghiệm và xác minh bởi Fleiss [2] sẽ là lựa chọn đúng đắn, nhưng đây dường như không phải là bản duy nhất được công bố có vẻ đúng (và được sử dụng trong suốt tài liệu gần đây).
Ngay bây giờ tôi có hai cách cụ thể để tính toán phương sai mẫu lớn không triệu chứng của nó:
- Phương pháp sửa lỗi được công bố bởi Fleiss, Cohen và Everitt [2];
- Phương pháp delta có thể được tìm thấy trong cuốn sách của Colgaton, 2009 [4] (trang 106).
Để minh họa một số nhầm lẫn này, đây là một trích dẫn của Fleiss, Cohen và Everitt [2], nhấn mạnh của tôi:
Nhiều nỗ lực của con người đã bị nguyền rủa với những thất bại lặp đi lặp lại trước khi đạt được thành công cuối cùng. Tỷ lệ của đỉnh Everest là một ví dụ. Việc khám phá ra đoạn Tây Bắc là một giây. Đạo hàm của một lỗi tiêu chuẩn chính xác cho kappa là một phần ba .
Vì vậy, đây là một bản tóm tắt nhỏ về những gì đã xảy ra:
- 1960: Cohen xuất bản bài báo "Một hệ số thỏa thuận cho quy mô danh nghĩa" [1] giới thiệu biện pháp thỏa thuận điều chỉnh cơ hội giữa hai người được gọi là . Tuy nhiên, ông công bố các công thức không chính xác cho các tính toán phương sai.
- 1968: Everitt cố gắng sửa chúng, nhưng công thức của anh ta cũng không đúng.
- 1969: Fleiss, Cohen và Everitt xuất bản các công thức chính xác trong bài báo "Lỗi tiêu chuẩn mẫu lớn của Kappa và Kappa có trọng số" [2].
- 1971: Fleiss xuất bản một thống kê (nhưng khác) dưới cùng tên, với các công thức không chính xác cho phương sai.
- 1979: Fleiss Nee và Landis xuất bản các công thức đã sửa cho Fleiss ' .
Lúc đầu, hãy xem xét các ký hiệu sau. Ký hiệu này ngụ ý toán tử tổng nên được áp dụng cho tất cả các phần tử theo chiều mà dấu chấm được đặt:
p . j = k Σ i = 1 p i j
Bây giờ, người ta có thể tính Kappa là:
Trong đó
là thỏa thuận được quan sát và
là thỏa thuận cơ hội.
Cho đến nay, phép tính phương sai chính xác cho của Cohen được đưa ra bởi:
và theo giả thuyết null, nó được đưa ra bởi:
Phương pháp của Congalton dường như dựa trên phương pháp delta để thu được phương sai (Agresti, 1990; Agresti, 2002); tuy nhiên tôi không chắc chắn về phương thức delta là gì hoặc tại sao nó phải được sử dụng. Phương sai , theo phương pháp này, được đưa ra bởi:
trong đó
(Congalton sử dụng một chỉ số thay vì a , Nhưng dường như điều đó cũng có nghĩa tương tự. Ngoài ra, tôi cho rằng phải là một ma trận đếm, tức là ma trận nhầm lẫn trước khi được chia cho số lượng mẫu như liên quan theo công thức )
Một phần kỳ lạ khác là cuốn sách của Colgaton dường như đề cập đến bài báo gốc của Cohen, nhưng dường như không trích dẫn các sửa đổi về phương sai Kappa do Fleiss et al xuất bản, cho đến khi ông tiếp tục thảo luận về Kappa có trọng số. Có lẽ ấn phẩm đầu tiên của ông được viết khi công thức thực sự cho kappa vẫn bị mất trong sự nhầm lẫn?
Có ai đó có thể giải thích tại sao những khác biệt? Hoặc tại sao một người nào đó sẽ sử dụng phương sai delta thay vì phiên bản đã sửa bởi Fleiss?
[1]: Hạm đội, Joseph L.; Cohen, Jacob; Everitt, BS; Lỗi tiêu chuẩn mẫu lớn của kappa và kappa có trọng số. Bản tin tâm lý, tập 72 (5), tháng 11 năm 1969, 323-327. doi: 10.1037 / h0028106
[2]: Cohen, Jacob (1960). Một hệ số thỏa thuận cho quy mô danh nghĩa. Đo lường giáo dục và tâm lý 20 (1): 37 trận46. DOI: 10.1177 / 001316446002000104.
[3]: Alan Agresti, Phân tích dữ liệu phân loại, phiên bản 2. John Wiley và con trai, 2002.
[4]: Russell G. Congalton và Green, K.; Đánh giá tính chính xác của dữ liệu được cảm nhận từ xa: Nguyên tắc và thông lệ, phiên bản 2. 2009.