Xuất phát từ tiêu cực. Bị mắc kẹt


13

Vì vậy, câu hỏi này có phần liên quan nhưng tôi đã cố gắng hết sức để làm cho nó thẳng thắn nhất có thể.

Mục tiêu: Câu chuyện dài ngắn, có một nguồn gốc của tiêu cực không liên quan đến các tích lũy bậc cao hơn, và tôi đang cố gắng hiểu làm thế nào nó được bắt nguồn.

Bối cảnh: (Tôi hiểu tất cả điều này)

Tôi đang tự nghiên cứu cuốn sách 'Phân tích thành phần độc lập' , được tìm thấy ở đây. (Câu hỏi này nằm trong phần 5.6, trong trường hợp bạn có cuốn sách - 'Xấp xỉ Entropy theo các hàm không đa thức').

Chúng ta có , là một biến ngẫu nhiên, và chúng ta muốn ước lượng âm tính từ một số quan sát mà chúng ta có. PDF của được cho bởi . Negentropy đơn giản là sự khác biệt giữa entropy vi sai của biến ngẫu nhiên Gaussian được tiêu chuẩn hóa và entropy vi phân của . Entropy khác biệt ở đây được đưa ra bởi H , sao cho:xxpx(ζ)xH

H(x)=px(ζ)log(px(ζ))dζ

và vì vậy, phủ định được đưa ra bởi

J(x)=H(v)H(x)

Trong đó v là một Gaussian chuẩn hóa, với PDF được cung cấp bởi ϕ(ζ) .

Bây giờ, là một phần của phương pháp mới này, cuốn sách của tôi đã lấy được ước tính về PDF của x , được đưa ra bởi:

px(ζ)=ϕ(ζ)[1+iciFi(ζ)]

(Nơi ci=E{Fi(x)} . Bằng cách này, ikhông một quyền lực, nhưng một chỉ số thay).

Hiện tại, tôi 'chấp nhận' công thức PDF mới này và sẽ hỏi về nó vào một ngày khác. Đây không phải là vấn đề chính của tôi. Mặc dù vậy, những gì anh ta làm bây giờ là cắm phiên bản PDF của x vào phương trình phủ định và kết thúc bằng:

J(x)12iE{Fi(x)}2

Hãy nhớ rằng, sigma (ở đây và cho phần còn lại của bài viết), chỉ cần các vòng lặp xung quanh chỉ số . Ví dụ: nếu chúng ta chỉ có hai hàm, tín hiệu sẽ lặp cho và . Tất nhiên, tôi nên nói với bạn về những chức năng anh ấy đang sử dụng. Vì vậy, rõ ràng, các hàm được định nghĩa như sau:i = 2 i = 2 F iii=2i=2Fi

Các hàm không phải là các hàm đa thức trong trường hợp này. (Chúng tôi giả sử rằng rv có nghĩa là 0 và phương sai đơn vị). Bây giờ, chúng ta hãy thực hiện một số ràng buộc và đưa ra các thuộc tính của các hàm đó: xFix

Fn+1(ζ)=ζ,cn+1=0

Fn+2(ζ)= =ζ2,cn+1= =1

Để đơn giản hóa các phép tính, chúng ta hãy thực hiện một giả định khác, hoàn toàn là kỹ thuật: Các hàm , tạo thành một hệ thống trực giao, như sau:FTôi,Tôi= =1,...n

φ(ζ)FTôi(ζ)Fj(ζ)dζ= ={1,nếu Tôi= =j0,nếu Tôij

φ(ζ)FTôi(ζ)ζkd(ζ)= =0,cho k= =0,1,2

Sắp đến rồi! OK, vì vậy tất cả đó là nền tảng, và bây giờ cho câu hỏi. Nhiệm vụ là sau đó, chỉ cần đặt tệp PDF mới này vào công thức entropy vi sai, . Nếu tôi hiểu điều này, tôi sẽ hiểu phần còn lại. Bây giờ, cuốn sách đưa ra đạo hàm, (và tôi đồng ý với nó), nhưng tôi bị mắc kẹt đến cuối cùng, bởi vì tôi không biết / xem nó đang bị hủy bỏ như thế nào. Ngoài ra, tôi không biết cách diễn giải ký hiệu nhỏ từ bản mở rộng Taylor.H(x)

Đây là kết quả:

Sử dụng mở rộng Taylor , với chúng tôi nhận được:H(x)(1+ϵ)log(1+ϵ)=ϵ+ϵ22+o(ϵ2)H(x)

H(x)=ϕ(ζ)(1+ciFi(ζ))(log(1+ΣcTôiFTôi(ζ)+tôiog(ζ))d(ζ)= =-φ(ζ)tôiog(ζ)-φ(ζ)ΣcTôiFTôi(ζ)tôiog(φ(ζ))-φ(ζ)[ΣcTôiFTôi(ζ)+12(ΣcTôiFTôi(ζ))2+o((ΣcTôiFTôi(ζ))2)]

và vì thế

Câu hỏi: (Tôi không hiểu điều này)

H(x)= =H(v)-0-0-12ΣcTôi2+o((ΣcTôi)2

Vì vậy, vấn đề của tôi: Ngoại trừ , tôi không hiểu làm thế nào anh ta có 4 thuật ngữ cuối cùng trong phương trình cuối cùng. (nghĩa là 0, 0 và 2 thuật ngữ cuối). Tôi hiểu mọi thứ trước đó. Anh ta nói rằng anh ta đã khai thác các mối quan hệ trực giao được đưa ra trong các thuộc tính ở trên, nhưng tôi không thấy thế nào. (Tôi cũng không hiểu ký hiệu o nhỏ ở đây, theo nghĩa là, nó được sử dụng như thế nào?)H(v)

CẢM ƠN!!!!

BIÊN TẬP:

Tôi đã đi trước và thêm những hình ảnh từ cuốn sách tôi đang đọc, nó nói khá nhiều những gì tôi đã nói ở trên, nhưng chỉ trong trường hợp ai đó cần bối cảnh bổ sung.

nhập mô tả hình ảnh ở đây nhập mô tả hình ảnh ở đây nhập mô tả hình ảnh ở đây

Và ở đây, được đánh dấu màu đỏ, là phần chính xác làm tôi bối rối. Làm thế nào anh ta sử dụng các thuộc tính trực giao để có được phần cuối cùng đó, nơi mọi thứ đang bị hủy bỏ, các tổng kết cuối cùng liên quan đến , và tổng kết ký hiệu nhỏ?cTôi2


1
Gợi ý : Viết rõ ràng và sử dụng các giả định đã nêu của tác giả để lấy các số không cho hai số hạng giữa. Phải có một số lỗi chính tả bao gồm trong trích dẫn khối; ví dụ: xuất hiện ở vị trí sai trong định nghĩa cơ sở trực giao mà bạn đưa ra. đăng nhậpφ(x)
Đức hồng y

@cardinal Ok, sửa lỗi đánh máy, cảm ơn. Điều đó đang được nói, tôi không rõ làm thế nào anh ta đang thực hiện hủy bỏ. Tôi đã thêm hình ảnh thực tế btw, từ chính cuốn sách.
Spacey

2
Thành thật mà nói, tôi cũng không biết làm thế nào hoặc tại sao điều này lại được di chuyển khỏi trang web toán học. Dù sao đi nữa, tôi rất vui khi có nó ở đây, nơi nó không kém gì ở nhà. Bạn đã đặt rất nhiều nỗ lực vào câu hỏi. :-)
Đức hồng y

2
@cardinal Tôi rất vui khi nghe bạn nói vậy. :-) Vâng, hy vọng khoản đầu tư tự học này sẽ trả hết vào một ngày nào đó. ;-)
Spacey

2
Nó sẽ, @Mohammad, nó sẽ! ICA cũng là một chủ đề rất thú vị :-).
Néstor

Câu trả lời:


9

Đầu tiên, hãy nhớ rằng là hằng số (chúng là giá trị kỳ vọng, số!) Để chúng có thể được đưa ra ngoài các tích phân (nếu bạn không thể nhìn thấy nó, lưu ý rằng Nếu ký hiệu làm phiền bạn, chỉ cần thay đổi bằng trên ).cTôi

cTôi= =p0(ξ)GTôi(ξ)dξ.
ξξ'cTôi

>> Để có được các điều khoản bằng không:

Hãy nhớ lại rằng . Theo đề xuất của @cardinal, bạn phải viết rõ ràng , bằng: Với điều này, bạn chỉ cần lưu ý rằng: trong đó Tôi đã bỏ các hằng số bên ngoài các tích phân.φ(ξ)= =điểm kinh nghiệm(-ξ2/2)/2πđăng nhậpφ(ξ)

đăng nhậpφ(ξ)= =-ξ2/2-đăng nhập2π.
cTôiφ(ξ)GTôi(ξ)đăng nhậpφ(ξ)= =-12cTôiφ(ξ)GTôi(ξ)ξ2-đăng nhập2πcTôiφ(ξ)GTôi(ξ),   (1)

Từ đây, lưu ý rằng trong (5.39) có ghi rằng là với . Tích phân trên thuật ngữ đầu tiên ở bên phải của eq. là dạng này (với ) và tích phân trong thuật ngữ thứ hai cũng vậy, (với ). Bạn chỉ cần khai thác sự thật này trên các khoản tiền và bạn đã hoàn tất!φ(ξ)FTôi(ξ)ξk0k= =0,1,2(1)k= =2k= =0

>> Để có được điều khoản:ΣcTôi2

Lưu ý rằng tích phân cần thu được để có được các điều khoản này là: Chúng ta có thể sử dụng định lý đa cực để mở rộng tổng bình phương. Điều này mang lại cho chúng tôi: Tuy nhiên, từ (5.39) một lần nữa, lưu ý rằng tất cả các điều khoản trong tổng này bao gồm các tích phân cho mẫu bằng 0 đối với và một đối với . Điều này để lại cho chúng tôi kết quả

φ(ξ)(ΣTôi= =1ncTôiGTôi(ξ))2dξ.
φ(ξ)Σk1+k2+...kn= =22!k1!k2!...kn!Π1tn(ctGt(ξ))ktdξ.
φ(ξ)GTôi(ξ)Gj(ξ)dξ
TôijTôi= =j
φ(ξ)(ΣcTôiGTôi(ξ))2dξ= =ΣcTôi2.

>> Thông tin về các ký hiệuo(bất cứ điều gì)

Tôi nghĩ rằng điều này khá khó hiểu từ các tác giả, nhưng tôi nhớ rằng họ sử dụng nó chỉ để nói rằng có các điều khoản về trật tự mỗi khi họ đặt (nghĩa là giống như lớn -O ký hiệu). Tuy nhiên, như @Macro đã nhận xét về cùng một câu trả lời này, có một sự khác biệt giữa ký hiệu big-O và little-O. Có lẽ bạn nên tự kiểm tra và xem cái nào phù hợp với vấn đề trong bài viết Wikipedia này .bất cứ điều gìo(bất cứ điều gì)

PS: Đây là một cuốn sách tuyệt vời. Các bài viết của các tác giả về chủ đề này cũng rất tốt và phải đọc nếu bạn đang cố gắng để hiểu và thực hiện ICA.


1
(+1) Câu trả lời hay. Nếu các khoản tiền là vô hạn, chúng ta phải cẩn thận hơn trong việc hoán đổi chúng với tích phân. Nếu chúng là hữu hạn (như OP gợi ý, nhưng tôi không nhìn kỹ vào hình ảnh) thì mọi thứ đều đơn giản, như bạn đã thể hiện. :-)
hồng y

À đúng rồi! Cảm ơn Nestor, nhưng còn hai kết quả cuối cùng, nghĩa là tổng kết với và tổng kết với phần ký hiệu nhỏ thì sao? cTôi2
Spacey

1
@cardinal: Ồ vâng! Chúng là hữu hạn (tôi không biết tại sao tôi viết chúng ở nơi vô hạn ...). Tôi đã thay đổi điều đó trên câu trả lời của tôi.
Néstor

@Mohammad, tôi đang viết câu trả lời cho hai câu hỏi khác của bạn ;-).
Néstor

1
@ Néstor, +1 cho câu trả lời này nhưng lại: bình luận cuối cùng của bạn, tôi nghĩ có một sự phân biệt giữa ký hiệu big-O và little-o .
Macro
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.