Các hoạt động này đang được thực hiện trên khả năng chứ không phải xác suất. Mặc dù sự khác biệt có thể tinh tế, bạn đã xác định một khía cạnh quan trọng của nó: sản phẩm của hai mật độ không bao giờ là mật độ.
Ngôn ngữ trong blog gợi ý về điều này - nhưng đồng thời cũng bị sai một cách tinh vi - vì vậy hãy phân tích nó:
Giá trị trung bình của phân phối này là cấu hình mà cả hai ước tính đều có khả năng nhất và do đó là dự đoán tốt nhất về cấu hình thực được cung cấp cho tất cả thông tin chúng tôi có.
Chúng tôi đã quan sát sản phẩm không phải là một phân phối. (Mặc dù nó có thể được biến thành một thông qua nhân với một số phù hợp, nhưng đó không phải là những gì đang diễn ra ở đây.)
Các từ "ước tính" và "dự đoán tốt nhất" chỉ ra rằng máy móc này đang được sử dụng để ước tính một tham số - trong trường hợp này là "cấu hình thực" (tọa độ x, y).
Thật không may, có nghĩa là không đoán tốt nhất. Các chế độ được. Đây là Nguyên tắc Khả năng tối đa (ML).
Để giải thích cho blog có ý nghĩa, chúng tôi phải giả sử như sau. Đầu tiên, có một vị trí thực sự, xác định. Hãy trừu tượng gọi nó là . Thứ hai, mỗi "cảm biến" không được báo cáo μ . Thay vào đó nó báo cáo một giá trị X i mà có thể được gần gũi với μ . "Gaussian" của cảm biến cho mật độ xác suất để phân phối X i . Là rất rõ ràng, mật độ cho cảm biến i là một hàm f i , tùy thuộc vào μ , với tài sản đó cho bất kỳ khu vực R (trong mặt phẳng), những cơ hội mà các cảm biến sẽ báo cáo một giá trị trong R làμμXiμXiifiμRR
Pr(Xi∈R)=∫Rfi(x;μ)dx.
Thứ ba, hai cảm biến được cho là hoạt động với sự độc lập vật lý , được dùng để ám chỉ sự độc lập thống kê .
Theo định nghĩa, các khả năng của hai quan sát là xác suất mật độ họ sẽ có theo phân phối chung này, đưa vị trí đúng là . Giả định độc lập ngụ ý rằng đó là sản phẩm của mật độ. Để làm rõ một điểm tinh tế, μx1,x2μ
Chức năng sản phẩm mà chuyển nhượng đến một quan sát là không một mật độ xác suất cho ; Tuy nhiên,x xf1(x;μ)f2(x;μ)xx
Sản phẩm là mật độ chung cho cặp được đặt hàng .( x 1 , x 2 )f1(x1;μ)f2(x2;μ)(x1,x2)
Trong hình được đăng, là trung tâm của một đốm màu, là tâm của điểm khác và các điểm trong không gian của nó biểu thị các giá trị có thể có của . Chú ý rằng không phải cũng không được thiết kế để nói bất cứ điều gì ở tất cả về xác suất của ! chỉ là một giá trị cố định không xác định . Đây không phải là một biến ngẫu nhiên.x1x2μf1f2μμ
Đây là một bước ngoặt tinh tế khác: khả năng được coi là một chức năng của . Chúng tôi có dữ liệu - -chúng tôi chỉ cố gắng để tìm ra những gì là khả năng được. Vì vậy, những gì chúng ta cần phải có âm mưu là chức năng khả năngμμ
Λ(μ)=f1(x1;μ)f2(x2;μ).
Một sự trùng hợp ngẫu nhiên là điều này cũng xảy ra là một Gaussian! Các cuộc biểu tình được tiết lộ. Chúng ta hãy làm toán chỉ trong một chiều (chứ không phải hai hoặc nhiều hơn) để xem mẫu - mọi thứ đều khái quát cho nhiều chiều hơn. Logarit của một Gaussian có dạng
logfi(xi;μ)=Ai−Bi(xi−μ)2
cho hằng số và . Do đó, khả năng đăng nhập làAiBi
logΛ(μ)=A1−B1(x1−μ)2+A2−B2(x2−μ)2=C−(B1+B2)(μ−B1x1+B2x2B1+B2)2
trong đó không phụ thuộc vào . Đây là nhật ký của một Gaussian trong đó vai trò của đã được thay thế bằng giá trị trung bình có trọng số đó được hiển thị trong phân số.Cμxi
Hãy trở lại chủ đề chính. Ước tính ML của là giá trị đó tối đa hóa khả năng. Tương tự, nó tối đa hóa Gaussian này mà chúng ta vừa bắt nguồn từ sản phẩm của Gaussian. Theo định nghĩa, tối đa là một chế độ . Đó là sự trùng hợp - xuất phát từ sự đối xứng điểm của mỗi Gaussian xung quanh tâm của nó - rằng chế độ xảy ra trùng với giá trị trung bình.μ
Phân tích này đã tiết lộ rằng một số sự trùng hợp trong tình huống cụ thể đã che khuất các khái niệm cơ bản:
một phân phối đa biến (chung) dễ bị nhầm lẫn với phân phối đơn biến (không phải là phân phối);
khả năng trông giống như một phân phối xác suất (mà nó không phải);
sản phẩm của Gaussian tình cờ là Gaussian (một sự đều đặn thường không đúng khi các cảm biến thay đổi theo cách không phải Gaussian);
và chế độ của chúng xảy ra trùng khớp với giá trị trung bình của chúng (chỉ được đảm bảo cho các cảm biến có phản ứng đối xứng xung quanh các giá trị thực).
Chỉ bằng cách tập trung vào các khái niệm này và loại bỏ các hành vi trùng hợp, chúng ta mới có thể thấy những gì đang thực sự xảy ra.