Khả năng
Các vấn đề phổ biến trong lý thuyết xác suất đề cập đến xác suất quan sát đưa ra một mô hình nhất định và đưa ra các tham số (hãy gọi chúng là ) liên quan. Ví dụ, xác suất cho các tình huống cụ thể trong trò chơi bài hoặc trò chơi súc sắc thường rất đơn giản.x1,x2,...,xnθ
Tuy nhiên, trong nhiều tình huống thực tế, chúng ta đang xử lý một tình huống nghịch đảo ( thống kê suy luận ). Đó là: quan sát được đưa ra và bây giờ mô hình không xác định hoặc ít nhất chúng ta không biết một số tham số nhất định .x1,x2,...,xkθ
Trong các loại vấn đề này, chúng tôi thường đề cập đến một thuật ngữ gọi là khả năng của các tham số, , đó là tỷ lệ tin vào một tham số cụ thể đưa ra các quan sát . Thuật ngữ này được biểu thị theo tỷ lệ thuận với xác suất của các quan sát giả sử rằng một tham số mô hình sẽ là giả thuyết đúng. L(θ)θx1,x2,..xkx1,x2,..xkθL(θ,x1,x2,..xk)∝probability observations x1,x2,..xk given θ
Đối với một giá trị tham số đã cho càng có nhiều khả năng quan sát nhất định là (liên quan đến xác suất với các giá trị tham số khác), quan sát càng hỗ trợ tham số cụ thể này (hoặc giả thuyết / giả thuyết giả định tham số này) . Khả năng cao (tương đối) sẽ củng cố niềm tin của chúng tôi về giá trị tham số đó (có nhiều triết lý hơn để nói về điều này).θx1,x2,..xn
Khả năng trong vấn đề xe tăng Đức
Bây giờ đối với bài toán xe tăng của Đức, hàm khả năng cho một tập hợp các mẫu là:x1,x2,..xk
L(θ,x1,x2,..xk)=Pr(x1,x2,..xk,θ)={0(θk)−1if max(x1,x2,..xk)>θif max(x1,x2,..xk)≤θ,
Cho dù bạn quan sát các mẫu {1, 2, 10} hay các mẫu {8, 9, 10} đều không thành vấn đề khi các mẫu được xem xét từ phân phối đồng đều với tham số . Cả hai mẫu đều có khả năng như nhau với xác suất và sử dụng ý tưởng về khả năng một mẫu không cho biết nhiều hơn về tham số so với mẫu khác.θ(θ3)−1θ
Các giá trị cao {8, 9, 10} có thể khiến bạn nghĩ / tin rằng nên cao hơn. Nhưng, đó chỉ là giá trị {10} Thực sự cung cấp cho bạn thông tin có liên quan về khả năng của (giá trị 10 cho bạn biết rằng sẽ là mười hoặc cao hơn, các giá trị khác 8 và 9 không đóng góp gì cho thông tin này ).θθθ
Định lý nhân tố Fisher Neyman
Định lý này cho bạn biết rằng một thống kê (nghĩa là một số chức năng của các quan sát, như giá trị trung bình, trung bình hoặc như trong bài toán xe tăng Đức tối đa) là đủ (chứa tất cả thông tin) khi bạn có thể tính ra, trong hàm khả năng, các thuật ngữ phụ thuộc vào các quan sát khác , , sao cho yếu tố này không phụ thuộc vào cả tham số và (và một phần của hàm khả năng liên quan đến dữ liệu với các giá trị tham số giả thuyết chỉ phụ thuộc vào thống kê chứ không phụ thuộc vào toàn bộ dữ liệu / quan sát).T(x1,x2,…,xk)x1,x2,…,xkθx1,x2,…,xk
Trường hợp của vấn đề xe tăng Đức là đơn giản. Bạn có thể thấy ở trên rằng toàn bộ biểu thức cho Khả năng ở trên chỉ phụ thuộc vào thống kê và phần còn lại của các giá trị không quan trọng.max(x1,x2,..xk)x1,x2,..xk
Trò chơi nhỏ làm ví dụ
Giả sử chúng ta chơi trò chơi sau nhiều lần: tự nó là một biến ngẫu nhiên và được vẽ với xác suất bằng nhau là 100 hoặc 110. Sau đó, chúng ta vẽ một mẫu .θx1,x2,...,xk
Chúng tôi muốn chọn một chiến lược để đoán , dựa trên tối đa hóa xác suất của chúng tôi để có dự đoán đúng về .θx1,x2,...,xkθ
Chiến lược phù hợp sẽ là chọn 100 trừ khi một trong các số trong mẫu là> 100.
Chúng ta có thể muốn chọn giá trị tham số 110 khi nhiều có xu hướng là tất cả các giá trị cao gần trăm (nhưng không chính xác hơn trăm), nhưng điều đó sẽ sai. Xác suất quan sát như vậy sẽ lớn hơn khi giá trị tham số thực là 100 so với khi nó là 110. Vì vậy, nếu chúng ta đoán, trong tình huống đó, 100 là giá trị tham số, thì chúng ta sẽ ít mắc lỗi hơn (vì tình trạng với các giá trị cao này gần hàng trăm, nhưng vẫn ở dưới nó, xảy ra thường xuyên hơn trong trường hợp giá trị thực là 100 thay vì trường hợp giá trị thực là 110).x1,x2,...,xk