Ý nghĩa của các ký hiệu xác suất và


27

Sự khác biệt về ý nghĩa giữa ký hiệu và thường được sử dụng trong nhiều sách và giấy tờ là gì?P(z;d,w)P(z|d,w)


13
f (x;) giống như f (x | θ), đơn giản có nghĩa là θ là một tham số cố định và hàm f là hàm của x. f (x, Θ), OTOH, là một phần tử của một họ (tập hợp) các hàm, trong đó các phần tử được lập chỉ mục bởi. Một sự khác biệt tinh tế, có lẽ, nhưng một điều quan trọng, đặc biệt. khi đến lúc ước tính một tham số chưa biết trên cơ sở dữ liệu đã biết x; tại thời điểm đó, thay đổi và x là cố định, dẫn đến "hàm khả năng". Cách sử dụng "|" là phổ biến hơn giữa các nhà thống kê, ";" giữa các nhà toán học.
Jbowman

Có jbowman là chính xác. Đôi khi chúng ta gọi nó là mật độ của X đã cho Θ.
Michael R. Chernick

@jbowman tại sao không đăng nó như một câu trả lời? Câu hỏi duy nhất của tôi là - tại sao họ sẽ sử dụng cả hai, nhưng tôi cho rằng nó có liên quan đến bối cảnh ("|" được sử dụng với "P" và ";" với " "). f
Abe

Suy nghĩ tốt, Abe; đó có lẽ là nó là chung chung hơn, tôi cho rằng. f
jbowman

Câu trả lời:


12

Tôi tin rằng nguồn gốc của điều này là mô hình khả năng (mặc dù tôi chưa kiểm tra tính chính xác lịch sử thực tế dưới đây, đó là một cách hiểu hợp lý về cách thức iot xuất hiện).

Giả sử trong cài đặt hồi quy, bạn sẽ có phân phối: p (Y | x, beta) Có nghĩa là: phân phối Y nếu bạn biết (có điều kiện) các giá trị x và beta.

Nếu bạn muốn ước tính betas, bạn muốn tối đa hóa khả năng: L (beta; y, x) = p (Y | x, beta) Về cơ bản, bây giờ bạn đang xem biểu thức p (Y | x, beta) là một chức năng của beta, nhưng ngoài điều đó ra, không có sự khác biệt (đối với các biểu thức chính xác toán học mà bạn có thể rút ra một cách chính xác, đây là một điều cần thiết --- mặc dù trong thực tế không có ai phiền cả).

Sau đó, trong cài đặt bayes, sự khác biệt giữa các tham số và các biến khác sẽ sớm mất dần, do đó, một bắt đầu để bạn sử dụng cả hai ký hiệu xen kẽ.

Vì vậy, về bản chất: không có sự khác biệt thực tế: cả hai đều chỉ ra sự phân phối có điều kiện của vật ở bên trái, có điều kiện ở (các) vật ở bên phải.


23

là mật độ của biến ngẫu nhiên X tại điểm x , với θ là tham số của phân phối. f ( x , θ ) là mật độ chung của X Θ tại điểm ( x , θ ) và chỉ có ý nghĩa nếu Θ là một biến ngẫu nhiên. f ( x | q ) là phân phối có điều kiện của X cho Θ , và một lần nữa, chỉ có ý nghĩa nếuf(x;θ)Xxθf(x,θ)XΘ(x,θ)Θf(x|θ)XΘ là một biến ngẫu nhiên. Điều này sẽ trở nên rõ ràng hơn nhiều khi bạn tìm hiểu sâu hơn về cuốn sách và xem xét phân tích Bayes.Θ


Uhhhh ... là phân phối có điều kiện của x cho θ làm cho cảm giác hoàn hảo ngay cả khi θ không phải là một biến ngẫu nhiên. Đó là khá nhiều ký hiệu chuẩn trong thống kê cổ điển, nơi θ không phải là một biến ngẫu nhiên. f(x|θ)xθθθ
jbowman

Uhhhh .... nếu bạn giải thích điều đó có nghĩa là P [Θ = θ] = 1 (trái Θ là biến ngẫu nhiên, phải là hằng số) thì tôi đồng ý. Mặt khác, tôi không ... vì vậy P [Θ = θ] nghĩa là gì trong mẫu số của định nghĩa phân phối có điều kiện?
PeterR

Mẫu số? Tôi có thể viết trong đó f là phân phối chuẩn mà không cần tham chiếu đến Quy tắc của Bayes. μσ là cố định. Những người khác cũng làm như vậy, ví dụ, ll.mit.edu/mission/cransiances/ist/publications/iêu . xf(x|μ,σ)fμσ
jbowman

jbowman, vậy định nghĩa của f (x | μ,) của bạn là mật độ có điều kiện khi và σ là các số cố định (tức là không phải là biến ngẫu nhiên)?
PeterR

1
Từ "có điều kiện", liên quan đến ký hiệu f (X | Y), được định nghĩa là "có điều kiện khi xảy ra một số sự kiện ngẫu nhiên". Nếu bạn đang sử dụng nó để chỉ một cái gì đó khác, chẳng hạn như "đã cho", như trong "f (x) đã cho (giá trị cụ thể của) và", thì đó là ký hiệu f (x;,) là cho. Vì OP đã hỏi về ý nghĩa của ký hiệu, chúng ta nên chính xác về ký hiệu trong câu trả lời.
PeterR

18

f(x;θ) là giống nhưf(x|θ) , chỉ đơn giản có nghĩa làθ là một tham số cố định và chức năngf là một hàm củax . f(x,Θ) , OTOH, là một yếu tố của một gia đình (hoặc bộ) của các chức năng, nơi mà các yếu tố được lập chỉ mục bởiΘ . Một sự khác biệt tinh tế, có lẽ, nhưng một điều quan trọng, đặc biệt. khi nói đến thời gian để ước lượng một tham số chưa biếtθ trên cơ sở dữ liệu được biết đếnx ; tại thời điểm đó,θ khác nhau vàxđược cố định, dẫn đến "chức năng khả năng". Cách sử dụng là phổ biến hơn ở nhà thống kê, trong khi ;giữa các nhà toán học.


1
Làm thế nào là được nói bằng lời? Bạn có nói "f của x cho θ" không? f(x;θ)
stackoverflowuser2010

@ stackoverflowuser2010 - vâng, chính xác là như vậy.
jbowman

2
Tôi tìm thấy trong một số video của Coursera rằng giáo sư Andrew Ng của Stanford đã xác minh bằng dấu chấm phẩy là "tham số hóa". Xem: class.coursera.org/ml-005/lecture 432 . Vì vậy, ví dụ sẽ được nói là "f của x được tham số hóa bởi theta".
stackoverflowuser2010

5
Nói "đã cho" hoặc "có điều kiện" rất khác nhau (nói chung) với "tham số hóa". Tôi ghét nếu ai đó nhìn thấy điều này và nghĩ rằng hai người là tương đương nhau. Nói "tham số hóa" chỉ thích hợp khi đại lượng được điều hòa là tham số lập chỉ mục pdf của biến trong thuật ngữ đầu tiên. Đối với hai biến (ví dụ: f (x; y)), sử dụng thuật ngữ đó sẽ sai.
ATJ

2
@MikeWilliamson - Chắc chắn, chọn một ký hiệu nơi bạn biết mọi thứ có nghĩa là gì và gắn bó với nó! Theo cách đó, khi bạn quay lại với những gì bạn đã làm trước đó, như 4 giờ trước đó theo kinh nghiệm của tôi, bạn không cần phải hiểu ý của bạn khi bạn sử dụng "|" đó. Tôi đồng ý, điều đó thật khó chịu, nhưng sau một thời gian bạn chỉ cần quan sát việc sử dụng ký hiệu đầu tiên và ghi nhớ nó cho phần còn lại của giấy / sách; dù sao thì sự khác biệt thường không phải là điều quan trọng.
jbowman

9

Mặc dù không phải lúc nào cũng như vậy, ngày nay thường được sử dụng khi d , w không phải là biến ngẫu nhiên (không nhất thiết phải nói rằng chúng nhất thiết phải được biết đến). P ( z | d , w ) biểu thị điều hòa trên các giá trị của d , w . Điều hòa là một hoạt động trên các biến ngẫu nhiên và như vậy sử dụng ký hiệu này khi d , w không biến ngẫu nhiên là khó hiểu (và bi thảm chung).P(z;d,w)d,wP(z|d,w)d,wd,w

Như @Nick Sabbe chỉ ra là một ký hiệu phổ biến để phân phối lấy mẫu dữ liệu quan sát y . Một số người thường xuyên sẽ sử dụng ký hiệu này nhưng nhấn mạnh rằng Θ không phải là một biến ngẫu nhiên, đó là một lạm dụng IMO. Nhưng họ không có độc quyền ở đó; Tôi cũng đã thấy Bayes cũng làm điều đó, giải quyết các siêu âm cố định ở cuối các điều kiện.p(y|X,Θ)yΘ


2
Đoạn thứ 2 của bạn, đáng để chỉ ra rằng trong các tình huống thống kê điển hình (giả sử, phù hợp với mô hình hồi quy), cũng không được coi là một biến ngẫu nhiên, mà là một tập hợp các hằng số đã biết. X
gung - Phục hồi Monica
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.