Giá trị mong đợi của biến ngẫu nhiên Gaussian được chuyển đổi bằng hàm logistic


10

Cả hàm logistic và độ lệch chuẩn thường được ký hiệu là . Tôi sẽ sử dụng và cho độ lệch chuẩn.σσ(x)=1/(1+exp(x))s

Tôi có một neuron hậu cần với một đầu vào ngẫu nhiên mà có nghĩa là và độ lệch chuẩn tôi biết. Tôi hy vọng sự khác biệt từ giá trị trung bình có thể được xấp xỉ bằng một số nhiễu Gaussian. Vì vậy, với việc lạm dụng một chút ký hiệu, giả sử nó tạo ra . Giá trị mong đợi của gì? Độ lệch chuẩn có thể là lớn hay nhỏ so với hoặc . Một xấp xỉ dạng đóng tốt cho giá trị mong đợi sẽ gần như là một giải pháp dạng đóng.μsσ(μ+N(0,s2))=σ(N(μ,s2))σ(N(μ,s2))sμ1

Tôi không nghĩ rằng một giải pháp dạng kín tồn tại. Điều này có thể được xem như một tích chập và hàm đặc trưng cho mật độ logistic đã được biết ( ), nhưng tôi không chắc điều đó có ích gì. Máy tính biểu tượng nghịch đảo không thể nhận ra mật độ bằng của tích chập mật độ phân phối logistic và phân phối chuẩn thông thường, điều này cho thấy nhưng không chứng minh rằng không có tích phân sơ cấp đơn giản. Bằng chứng hoàn cảnh hơn: Trong một số bài viết về việc thêm nhiễu đầu vào Gaussian vào các mạng nơ ron có nơ ron logistic, các bài báo cũng không đưa ra biểu thức dạng đóng.πt csch πt0

Câu hỏi này nảy sinh trong việc cố gắng hiểu lỗi trong xấp xỉ trường trung bình trong các máy Boltzman.

Câu trả lời:


5

Sau đây là những gì tôi đã sử dụng:

Viết trong đó . Chúng ta có thể sử dụng một bản mở rộng Taylor series.σ(N(μ,s2))=σ(μ+X)XN(0,s2)

σ(μ+X)=σ(μ)+Xσ(μ)+X22σ(μ)+...+Xnn!σ(n)(μ)+...

E[σ(μ+X)]=E[σ(μ)]+E[Xσ(μ)]+E[X22σ(μ)]+...=σ(μ)+0+s22σ(μ)+0+3s424σ(4)(μ)+...+s2k2kk!σ(2k)(μ)...

Có những vấn đề hội tụ. Hàm logistic có một cực trong đó , vì vậy tại , lẻ. Phân kỳ không giống như tiền tố là vô dụng, nhưng xấp xỉ chuỗi này có thể không đáng tin khi là đáng kể.exp(x)=1x=kπikP(|X|>μ2+π2)

Vì , chúng tôi có thể viết các đạo hàm của dưới dạng đa thức trong . Ví dụ: và . Các hệ số có liên quan đến OEIS A028246 .σ(x)=σ(x)(1σ(x))σ(x)σ(x)σ=σ3σ2+2σ3σ=σ7σ2+12σ36σ4


4

Những gì bạn có ở đây là một biến ngẫu nhiên tuân theo phân phối logit-normal (hoặc logistic-normal) (xem wikipedia ), nghĩa là, . Những khoảnh khắc của phân phối logit-bình thường không có giải pháp phân tích.logit[x]N(μ,s2)

Nhưng tất nhiên người ta có thể có được chúng thông qua tích hợp số. Nếu bạn sử dụng R, có gói logitnorm có mọi thứ bạn cần. Một ví dụ:

install.packages("logitnorm")
library(logitnorm)
momentsLogitnorm(mu=1, sigma=2)

Sản lượng này:

> momentsLogitnorm(mu=1, sigma=2)
      mean        var 
0.64772644 0.08767866

Vì vậy, thậm chí còn có một chức năng tiện lợi sẽ trực tiếp cung cấp cho bạn giá trị trung bình và phương sai.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.