Tôi có đầu ra độ chính xác phân loại theo tỷ lệ phần trăm và số lượng mẫu đầu vào. Có thử nghiệm nào có thể cho biết mức độ có ý nghĩa thống kê là kết quả dựa trên thông tin này.
Cảm ơn
Tôi có đầu ra độ chính xác phân loại theo tỷ lệ phần trăm và số lượng mẫu đầu vào. Có thử nghiệm nào có thể cho biết mức độ có ý nghĩa thống kê là kết quả dựa trên thông tin này.
Cảm ơn
Câu trả lời:
Bạn muốn xác định phân phối độ chính xác của chỉ cần đoán. Có lẽ nó giống như Ở đâu nhị thức (, ) cho một số được biết đến (nói 50%).
Sau đó tính toán cơ hội quan sát kết quả bạn đã làm, nếu mô hình null này là đúng. Trong R, bạn có thể sử dụng binom.test
hoặc tính toán trực tiếp với pbinom
.
Thông thường, bạn muốn so sánh độ chính xác không phải là "đoán" mà với một số phương pháp thay thế, trong trường hợp đó bạn có thể sử dụng thử nghiệm của McNemar ; trong R , mcnemar.test
.
Tôi không thấy nơi kiểm tra chống lại sự ngẫu nhiên hoàn toàn là hữu ích. Một trình phân loại chỉ có thể đánh bại các dự đoán ngẫu nhiên thuần túy không hữu ích lắm. Một vấn đề lớn hơn là việc bạn sử dụng tỷ lệ được phân loại chính xác như điểm chính xác của bạn. Đây là một quy tắc chấm điểm không liên tục có thể dễ dàng thao tác vì nó tùy tiện và không nhạy cảm. Một (nhiều) cách để thấy sự thiếu sót của nó là tính toán tỷ lệ được phân loại chính xác nếu bạn có một mô hình chỉ có một phần chặn. Nó sẽ cao nếu kết quả không gần 0,5 trong tỷ lệ hiện mắc.
Khi bạn chọn một quy tắc phù hợp hơn, sẽ rất có giá trị để tính khoảng tin cậy cho chỉ mục. Ý nghĩa thống kê là ít giá trị.
Để chắc chắn bạn có thể máy tính một khoảng tin cậy . Nếu độ chính xác của bạn được ước tính trên một bộ thử nghiệm các yếu tố, nó giữ rằng
Tôi nghĩ rằng bạn có thể tính toán hiệu suất của bạn khác bao nhiêu so với một tính toán ngẫu nhiên đạt được . Độ chính xác của phân loại ngẫu nhiên là:
Lợi ích là:
Tôi thực sự nghĩ rằng một bài kiểm tra thống kê có thể được phác thảo. Tử số có thể được xem như một biến ngẫu nhiên bình thường,, nhưng bạn nên tìm ra loại mẫu số ngẫu nhiên nào có thể là.
Bạn có thể quan tâm đến các giấy tờ sau đây:
Tôi nghĩ rằng họ bao gồm những gì Dimitrios Athanasakis nói về.
Tôi đã thực hiện một lựa chọn của Yeh theo cách mà tôi hiểu nó:
Tôi nghĩ rằng một điều bạn có thể thử sẽ là một bài kiểm tra hoán vị. Đơn giản chỉ cần đặt ngẫu nhiên hoán vị các cặp đầu ra mong muốn đầu vào mà bạn cung cấp cho bộ phân loại của bạn trong một số lần. Nếu nó không thể tái tạo bất cứ thứ gì ở cùng cấp trên 100 hoán vị khác nhau thì nó có ý nghĩa ở khoảng 99% và cứ thế. Về cơ bản, đây là quá trình tương tự được sử dụng để thu được các giá trị p (tương ứng với xác suất có được mối tương quan tuyến tính của cùng một số đo sau khi hoán vị ngẫu nhiên dữ liệu), v.v.