Sự tương đồng là nhiều hơn bề ngoài.
"Sự đánh đổi sai lệch" có thể được hiểu là Định lý Pythagore áp dụng cho hai vectơ Euclide vuông góc: độ dài của một là độ lệch chuẩn và độ dài của cái kia là độ lệch. Độ dài của cạnh huyền là lỗi bình phương gốc.
Một mối quan hệ cơ bản
Là một điểm khởi hành, hãy xem xét tính toán tiết lộ này, hợp lệ cho bất kỳ biến ngẫu nhiên với giây thứ hai hữu hạn và bất kỳ số thực . Vì khoảnh khắc thứ hai là hữu hạn, có nghĩa là hữu hạn mà , từ đómột X μ = E ( X ) E ( X - μ ) = 0XmộtXμ = E ( X)E (X- μ ) = 0
E ((X- a )2)= E ( ( X- μ+μ - a )2)= E ( ( X- μ )2) + 2 E ( X- μ ) ( μ - a ) + ( μ - a )2= Var( X) + ( μ - a )2.(1)
Chương trình này như thế nào độ lệch bình phương trung bình giữa và bất kỳ "cơ sở" giá trị thay đổi theo : nó là một hàm bậc hai của với tối thiểu tại , nơi độ lệch bình phương trung bình là phương sai của .a a a μ XXmộtmộtmộtμX
Kết nối với các ước tính và thiên vị
Bất kỳ công cụ ước tính là một biến ngẫu nhiên bởi vì (theo định nghĩa) nó là một hàm (có thể đo lường) của các biến ngẫu nhiên. Để cho nó đóng vai trò của ở trước và để cho ước tính (điều được ước tính) là , chúng ta có X θ θθ^Xθ^θ
MSE(θ^)=E((θ^−θ)2)=Var(θ^)+(E(θ^)−θ)2.
Bây giờ chúng ta hãy quay trở lại khi chúng ta đã thấy cách phát biểu về sai lệch + phương sai cho một công cụ ước tính đúng nghĩa là một trường hợp của . Câu hỏi tìm kiếm "sự tương tự toán học với các đối tượng toán học." Chúng ta có thể làm nhiều hơn thế bằng cách chỉ ra rằng các biến ngẫu nhiên có thể tích hợp vuông có thể tự nhiên được tạo thành một không gian Euclide.( 1 )(1)(1)
Nền toán học
Theo một nghĩa rất chung, một biến ngẫu nhiên là một hàm có giá trị thực (có thể đo lường) trên một không gian xác suất . Tập hợp các hàm như vậy có thể tích hợp vuông, thường được viết (với cấu trúc xác suất đã cho), gần như là một không gian Hilbert. Để làm cho nó thành một, chúng ta phải conflate bất kỳ hai biến ngẫu nhiên và mà không thực sự khác nhau về điều kiện hội nhập: đó là, chúng ta nói và là tương đương bất cứ khi nàoL 2 ( Ω ) X Y X Y(Ω,S,P)L2(Ω)XYXY
E(|X−Y|2)=∫Ω|X(ω)−Y(ω)|2dP(ω)=0.
Nó đơn giản để kiểm tra rằng đây là một quan hệ tương đương đúng: quan trọng nhất, khi tương đương với và tương đương với , sau đó nhất thiết sẽ tương đương với . Do đó, chúng tôi có thể phân vùng tất cả các biến ngẫu nhiên có thể tích hợp vuông thành các lớp tương đương. Các lớp này tạo thành tập . Hơn nữa, kế thừa cấu trúc không gian vectơ của được xác định bằng cách thêm các giá trị theo chiều dọc và phép nhân vô hướng theo chiều. Trên không gian vectơ này, hàmY Y Z X Z L 2 ( Ω ) L 2 L 2XYYZXZL2(Ω)L2L2
X→(∫Ω|X(ω)|2dP(ω))1/2=E(|X|2)−−−−−−√
là một chỉ tiêu , thường được viết . Định mức này biến thành không gian Hilbert. Hãy nghĩ về một không gian Hilbert là một "không gian Euclide vô hạn". Bất kỳ không gian con chiều hữu hạn thừa hưởng định mức từ và , với định mức này, là một không gian Euclide: chúng ta có thể thực hiện hình học Euclide trong đó.L 2 ( Ω ) H V ⊂ H H V||X||2L2(Ω)HV⊂HHV
Cuối cùng, chúng ta cần một thực tế đặc biệt đối với các không gian xác suất (chứ không phải là không gian đo chung): bởi vì là một xác suất, nó bị giới hạn (bởi ), từ đó các hàm không đổi (đối với bất kỳ số thực cố định ) là các biến ngẫu nhiên có thể tích hợp vuông với các chỉ tiêu hữu hạn. 1 ω → a aP1ω→aa
Một giải thích hình học
Xem xét bất kỳ vuông khả tích ngẫu nhiên biến , coi như là một đại diện của lớp tương đương của nó trong L 2 ( Ω ) . Nó có một bình μ = E ( X ) mà (như người ta có thể kiểm tra) chỉ phụ thuộc vào các lớp tương đương của X . Hãy 1 : w → 1 là lớp của biến ngẫu nhiên liên tục.XL2(Ω)μ=E(X)X1:ω→1
X1V⊂L2(Ω)2||X||22=E(X2)X||a1||22=a2ω→aX−μ11μ(1)
||X−a1||22=||X−μ1||22+||(a−μ)1||22.
Nó thực sự chính xác là Định lý Pythagore, về cơ bản giống như hình thức được biết đến 2500 năm trước. Đối tượng là cạnh huyền của một tam giác vuông có chân và .
X−a1=(X−μ1)−(a−μ)1
X−μ1(a−μ)1
Nếu bạn muốn các phép tương tự toán học, sau đó, bạn có thể sử dụng bất cứ điều gì có thể được biểu thị dưới dạng cạnh huyền của một tam giác vuông trong không gian Euclide. Đường huyền sẽ biểu thị "lỗi" và chân sẽ biểu thị độ lệch và độ lệch so với giá trị trung bình.