Kiểm tra giả thuyết giống như một vấn đề Phân loại. Vì vậy, nói rằng, chúng tôi có 2 nhãn có thể cho một quan sát (chủ đề) - Có tội so với Không có tội. Đặt Non-Guilty là giả thuyết null. Nếu chúng tôi đã xem xét vấn đề từ quan điểm Phân loại, chúng tôi sẽ đào tạo Trình phân loại để dự đoán xác suất của chủ thể thuộc mỗi 2 Lớp, được cung cấp Dữ liệu. Sau đó chúng tôi sẽ chọn Lớp có xác suất cao nhất. Trong trường hợp đó 0,5 xác suất sẽ là ngưỡng tự nhiên. Chúng tôi có thể thay đổi ngưỡng trong trường hợp chúng tôi đã chỉ định các chi phí khác nhau cho các lỗi Sai âm hoặc Sai. Nhưng hiếm khi chúng ta đi quá mức khi đặt ngưỡng ở mức 0,05, tức là chỉ định chủ đề cho Lớp "Có tội" chỉ khi xác suất là 0,95 hoặc cao hơn. Nhưng nếu tôi hiểu rõ, đây là những gì chúng ta đang làm như một thông lệ tiêu chuẩn khi chúng ta xem cùng một vấn đề như một vấn đề kiểm tra giả thuyết. Trong trường hợp sau này, chúng tôi sẽ không gán nhãn "Không phạm tội" - tương đương với việc gán nhãn "Có tội" - chỉ khi xác suất là "Không phạm tội" dưới 5%. Và có lẽ điều này có thể có ý nghĩa nếu chúng ta thực sự muốn tránh kết án những người vô tội. Nhưng tại sao quy tắc này sẽ chiếm ưu thế trong tất cả các Tên miền và mọi trường hợp?
Quyết định giả thuyết nào sẽ áp dụng tương đương với việc xác định Công cụ ước tính cho sự thật được cung cấp dữ liệu. Trong Ước tính khả năng tối đa, chúng tôi chấp nhận Giả thuyết có nhiều khả năng được cung cấp Dữ liệu - không nhất thiết là có khả năng cao hơn nhiều. Xem biểu đồ dưới đây:
Sử dụng phương pháp tiếp cận tối đa, chúng tôi sẽ ủng hộ Giả thuyết thay thế trong ví dụ này nếu giá trị của Dự đoán cao hơn 3, ví dụ 4, mặc dù xác suất của giá trị này được lấy từ Giả thuyết Null sẽ lớn hơn 0,05.
Và trong khi ví dụ mà tôi bắt đầu bài viết có lẽ mang tính cảm xúc, chúng ta có thể nghĩ về các trường hợp khác, ví dụ như một cải tiến kỹ thuật. Tại sao chúng ta nên cung cấp lợi thế như vậy cho Status Quo khi Dữ liệu cho chúng ta biết rằng xác suất giải pháp mới là một cải tiến lớn hơn xác suất mà nó không phải là?