Giải thích entropy cho phân phối liên tục?


7

"Entropy" đại khái nắm bắt mức độ "thông tin" trong phân phối xác suất.

Đối với các phân phối rời rạc, có một cách giải thích chính xác hơn nhiều: entropy của một biến ngẫu nhiên rời rạc là giới hạn thấp hơn trên số bit dự kiến ​​cần thiết để chuyển kết quả của biến ngẫu nhiên.

Nhưng đối với một biến ngẫu nhiên liên tục, có vô số kết quả vô hạn, vì vậy chúng ta thậm chí không thể bắt đầu chuyển giao kết quả chính xác nào đã xảy ra trong một chuỗi bit hữu hạn.

Một cách giải thích tương đương của entropy cho các biến liên tục là gì?


1
Bạn có định nghĩa nào về "mức độ thông tin" trong phân phối xác suất không?
kjetil b halvorsen

@kjetilbhalverson, tôi không thấy bạn đang đi đâu với điều này? Không phải là câu hỏi khá rõ ràng?
dùng56834

Tôi nghĩ rằng câu trả lời tốt được đưa ra ở đâyở đây .
COOLSerdash

@COOLSerdash hoàn hảo. Bạn có thể đưa ra câu trả lời liên kết với hai người đó không, và tôi sẽ cho bạn điểm.
dùng56834

@ Lập trình viên2134 Tôi thực sự đánh giá cao nó nhưng tôi không cảm thấy thoải mái khi chỉ đăng các liên kết mà không có nhiều bối cảnh (điều này không được khuyến khích ở đây) và nhận được điểm cho nó. Tôi xin lỗi.
COOLSerdash

Câu trả lời:


4

Do mật độ giới hạn của các điểm rời rạc , nên việc giải thích không thể khái quát thành

S=xp(x)lnp(x)
S=dx(p(x)lnp(x))

Bởi vì việc khái quát hóa trực tiếp dẫn đến Rõ ràng, phát nổ.

S=dxp(x)ln(p(x)dx)=dxp(x)ln(p(x))dxp(x)ln(dx)
lndx

Theo trực giác, vì , do đó, lý do sử dụng ít bit hơn để mã hóa thứ gì đó có nhiều khả năng xảy ra không giữ được . Vì vậy, chúng ta cần tìm một cách khác để giải thích , và lựa chọn là phân kỳ .p(x)dx=0S=dxp(x)ln(p(x)dx)KL

Giả sử chúng ta có phân phối đồng đều trong cùng một không gian trạng thái, thì chúng ta có Vì chỉ là hằng số, vì vậy chúng tôi giữ nguyên dạng và đồng thời xây dựng một đại lượng được xác định rõ ràng cho phân phối liên tục .q(x)

KL(p(x)q(x))=dxp(x)ln(p(x)dxq(x)dx)
q(x)S=dx(p(x)ln(p(x)dx))p(x)

Vì vậy, từ phân kỳ , entropy của phân phối liên tục có thể được hiểu là:KLp(x)

Nếu chúng ta sử dụng phân phối đồng đều để mã hóa , thì trung bình có bao nhiêu bit không cần thiết.p(x)


Câu cuối cùng của bạn là chủ đề của câu hỏi, nhưng nó không thực sự trả lời nó: Giải thích về tài sản nội tại của thành phố này là gì, nếu đó không phải là số bit?
dùng56834

2
Entropy là kỳ vọng của . Đó là vấn đề của giáo dục toán học mà mọi người thường thích viết từ chối như bạn làm, trước tiên là viết và sau đó lấy dấu trừ bên ngoài tích phân, nhưng câu trả lời của bạn cần sự điều chỉnh đó. . ln(1/P)lnP
Nick Cox

@ Nick Cox Cảm ơn bạn đã chỉ ra điều này, tôi đã chỉnh sửa nó.
meTchaikovsky

@ Lập trình2134 Tôi đã chỉnh sửa câu trả lời của mình, tôi hy vọng nó giải quyết câu hỏi tốt hơn.
meTchaikovsky

@ Lập trình2134 Nhờ câu hỏi của bạn, tôi thấy rằng tôi hoàn toàn hiểu sai cách giải thích của . Tôi đã sửa câu trả lời của mình. p(x)lnp(x)
meTchaikovsky

2

Bạn phân biệt vấn đề thông qua mật độ xác suất. Một biến ngẫu nhiên liên tục có mật độ , gần đúng cục bộ với , hiện là một dạng tương tự của trường hợp rời rạc . Và theo lý thuyết tính toán, các khoản tiền của bạn tương đương trở thành tích phân trên không gian trạng thái của bạn.f(x)P(X[x,x+δx])f(x)δx


1
Tôi có thể thiếu một cái gì đó, nhưng câu hỏi của tôi là về một giải thích. Tôi biết rằng một tích phân là một giới hạn của tổng.
dùng56834

1
Đây là một câu trả lời rất lạc quan! Tôi tin rằng nó phức tạp hơn nhiều
kjetil b halvorsen

@kjetilbhalvorsen: Yea, có rất nhiều chi tiết bị xô dưới bàn ở đây. Để biết lợi ích của OP, hãy xem phần 2.3.1 của điều này: crmarsh.com/static/pdf/Charles_Marsh_Continupt_Entropy.pdf
Alex R.

1
Bạn có thể giải thích câu trả lời này? Nó dường như gợi ý rằng bạn có thể ước chừng entropy liên tục bằng cách phân biệt phân phối với các thùng nhỏ. Nhưng liên kết của bạn cho thấy điều này không hoạt động và thậm chí còn nói rằng "công thức cho entropy liên tục không phải là một dẫn xuất của bất cứ điều gì"
Jonny Lomond
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.