Sự khác biệt về ý nghĩa giữa ký hiệu và thường được sử dụng trong nhiều sách và giấy tờ là gì?
Sự khác biệt về ý nghĩa giữa ký hiệu và thường được sử dụng trong nhiều sách và giấy tờ là gì?
Câu trả lời:
Tôi tin rằng nguồn gốc của điều này là mô hình khả năng (mặc dù tôi chưa kiểm tra tính chính xác lịch sử thực tế dưới đây, đó là một cách hiểu hợp lý về cách thức iot xuất hiện).
Giả sử trong cài đặt hồi quy, bạn sẽ có phân phối: p (Y | x, beta) Có nghĩa là: phân phối Y nếu bạn biết (có điều kiện) các giá trị x và beta.
Nếu bạn muốn ước tính betas, bạn muốn tối đa hóa khả năng: L (beta; y, x) = p (Y | x, beta) Về cơ bản, bây giờ bạn đang xem biểu thức p (Y | x, beta) là một chức năng của beta, nhưng ngoài điều đó ra, không có sự khác biệt (đối với các biểu thức chính xác toán học mà bạn có thể rút ra một cách chính xác, đây là một điều cần thiết --- mặc dù trong thực tế không có ai phiền cả).
Sau đó, trong cài đặt bayes, sự khác biệt giữa các tham số và các biến khác sẽ sớm mất dần, do đó, một bắt đầu để bạn sử dụng cả hai ký hiệu xen kẽ.
Vì vậy, về bản chất: không có sự khác biệt thực tế: cả hai đều chỉ ra sự phân phối có điều kiện của vật ở bên trái, có điều kiện ở (các) vật ở bên phải.
là mật độ của biến ngẫu nhiên X tại điểm x , với θ là tham số của phân phối. f ( x , θ ) là mật độ chung của X và Θ tại điểm ( x , θ ) và chỉ có ý nghĩa nếu Θ là một biến ngẫu nhiên. f ( x | q ) là phân phối có điều kiện của X cho Θ , và một lần nữa, chỉ có ý nghĩa nếu là một biến ngẫu nhiên. Điều này sẽ trở nên rõ ràng hơn nhiều khi bạn tìm hiểu sâu hơn về cuốn sách và xem xét phân tích Bayes.
là giống như , chỉ đơn giản có nghĩa là là một tham số cố định và chức năng là một hàm của . , OTOH, là một yếu tố của một gia đình (hoặc bộ) của các chức năng, nơi mà các yếu tố được lập chỉ mục bởi . Một sự khác biệt tinh tế, có lẽ, nhưng một điều quan trọng, đặc biệt. khi nói đến thời gian để ước lượng một tham số chưa biết trên cơ sở dữ liệu được biết đến ; tại thời điểm đó, khác nhau vàđược cố định, dẫn đến "chức năng khả năng". Cách sử dụng là phổ biến hơn ở nhà thống kê, trong khi giữa các nhà toán học.
Mặc dù không phải lúc nào cũng như vậy, ngày nay thường được sử dụng khi d , w không phải là biến ngẫu nhiên (không nhất thiết phải nói rằng chúng nhất thiết phải được biết đến). P ( z | d , w ) biểu thị điều hòa trên các giá trị của d , w . Điều hòa là một hoạt động trên các biến ngẫu nhiên và như vậy sử dụng ký hiệu này khi d , w không biến ngẫu nhiên là khó hiểu (và bi thảm chung).
Như @Nick Sabbe chỉ ra là một ký hiệu phổ biến để phân phối lấy mẫu dữ liệu quan sát y . Một số người thường xuyên sẽ sử dụng ký hiệu này nhưng nhấn mạnh rằng Θ không phải là một biến ngẫu nhiên, đó là một lạm dụng IMO. Nhưng họ không có độc quyền ở đó; Tôi cũng đã thấy Bayes cũng làm điều đó, giải quyết các siêu âm cố định ở cuối các điều kiện.