Làm thế nào để nhật ký (p (x, y)) bình thường hóa thông tin lẫn nhau theo quan điểm?


9

Tôi đang cố gắng để hiểu hình thức chuẩn hóa của thông tin lẫn nhau theo chiều.

npmi=pmi(x,y)log(p(x,y))

Tại sao xác suất khớp đăng nhập bình thường hóa thông tin lẫn nhau theo điểm nằm giữa [-1, 1]?

Thông tin lẫn nhau theo quan điểm là:

pmi=log(p(x,y)p(x)p(y))

p (x, y) được giới hạn bởi [0, 1] vì vậy log (p (x, y)) bị giới hạn bởi (, 0]. Có vẻ như nhật ký (p (x, y)) nên bằng cách nào đó cân bằng thay đổi trong tử số, nhưng tôi không hiểu chính xác làm thế nào. Nó cũng nhắc tôi về entropy , nhưng một lần nữa tôi không hiểu chính xác mối quan hệ.h=log(p(x))


Đối với người bắt đầu, thông tin tương hỗ theo chiều sử dụng logarit (tôi không chắc liệu lỗi chính tả của nó hay bạn đang sử dụng số lượng khác ).
Piotr Migdal

Câu trả lời:


12

Từ mục nhập Wikipedia về thông tin lẫn nhau theo chiều :

Thông tin lẫn nhau theo chiều có thể được chuẩn hóa giữa [-1, + 1] dẫn đến -1 (trong giới hạn) vì không bao giờ xảy ra cùng nhau, 0 cho độc lập và +1 cho sự xuất hiện hoàn toàn.

Tại sao nó xảy ra? Vâng, định nghĩa cho thông tin lẫn nhau theo chiều

pmTôiđăng nhập[p(x,y)p(x)p(y)]= =đăng nhậpp(x,y)-đăng nhậpp(x)-đăng nhậpp(y),

trong khi đó đối với thông tin tương hỗ theo chiều chuẩn hóa là:

npmTôipmTôi-đăng nhậpp(x,y)= =đăng nhập[p(x)p(y)]đăng nhậpp(x,y)-1.

Khi có:

  • không có sự xuất hiện đồng thời, , vì vậy nmpi là -1,đăng nhậpp(x,y)-
  • các lần xuất hiện ngẫu nhiên, , vì vậy nmpi là 0,đăng nhậpp(x,y)= =đăng nhập[p(x)p(y)]
  • hoàn thành các lần xuất hiện, , vì vậy nmpi là 1.đăng nhậpp(x,y)= =đăng nhậpp(x)= =đăng nhậpp(y)

Nó sẽ là một câu trả lời đầy đủ hơn để chỉ ra lý do tại sao npmi nằm trong khoảng . Xem bằng chứng của tôi trong câu trả lời khác. [-1,1]
Hans

1

Mặc dù câu trả lời của Piotr Migdal là thông tin trong việc đưa ra các ví dụ trong đó nmpi đạt được ba giá trị cực trị, nhưng điều đó không chứng minh rằng nó nằm trong khoảng . Đây là sự bất bình đẳng và dẫn xuất của nó. là cho bất kỳ sự kiện . Chia cả hai bên cho không âm , chúng ta có [-1,1]

đăng nhậpp(x,y)đăng nhậpp(x,y))-đăng nhậpp(x)-đăng nhậpp(y)= =đăng nhậpp(x,y)p(x)p(y)=:pmi(x;y)= =đăng nhậpp(y|x)+đăng nhậpp(y|x)-đăng nhậpp(x,y)-đăng nhậpp(x,y)
-đăng nhậpp(Một)0Mộth(x,y): =-đăng nhậpp(x,y)
-1nmpi(x;y): =mpi (x; y)h(x,y)1.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.