Xuất phát ma trận phân tán tổng (trong lớp + giữa lớp)


14

Tôi đã loay hoay với các phương pháp PCA và LDA và tôi bị mắc kẹt tại một điểm, tôi có cảm giác rằng nó đơn giản đến mức tôi không thể nhìn thấy nó.

Ma trận phân tán trong lớp ( ) và giữa lớp ( ) được định nghĩa là:S BSWSB

SW=i=1Ct=1N(xtiμi)(xtiμi)T

SB=i=1CN(μiμ)(μiμ)T

Tổng ma trận phân tán được đưa ra là:ST

ST=i=1Ct=1N(xtiμ)(xtiμ)T=SW+SB

Trong đó C là số lớp và N là số mẫu là mẫu, là trung bình của lớp, là trung bình tổng thể.μ i μxμiμ

Trong khi cố gắng rút ra tôi đã đi đến một điểm mà tôi có:ST

(xμi)(μiμ)T+(μiμ)(xμi)T

như một thuật ngữ. Điều này cần phải bằng không, nhưng tại sao?


Thật:

ST=i=1Ct=1N(xtiμ)(xtiμ)T=i=1Ct=1N(xtiμi+μiμ)(xtiμi+μiμ)T=SW+SB+i=1Ct=1N[(xtiμi)(μiμ)T+(μiμ)(xtiμi)T]

2
Câu trả lời là bạn đang tính tổng độ lệch của các giá trị xung quanh giá trị trung bình của chúng và tổng đó bằng không. Nhưng chính xác thì , và gì? Làm thế nào và liên quan đến và ? Chất lượng câu trả lời sẽ phụ thuộc vào cách chúng tôi đoán chính xác nhưng bạn đang buộc chúng tôi phải đoán rất nhiều! m m i m m i L L ixmmimmiμμi
whuber

@whuber: Bạn hoàn toàn đúng, tôi đã sửa lại câu hỏi của mình.
nimcap

Câu trả lời:


8

Nếu bạn giả sử

1Nt=1Nxti=μi

Sau đó

i=1Ct=1N(xtiμi)(μiμ)T=i=1C(t=1N(xtiμi))(μiμ)T=0

và công thức giữ. Bạn đối phó với thuật ngữ thứ hai theo cách tương tự.


2
(+1) Thuật ngữ thứ hai, là chuyển vị của từ thứ nhất, cũng phải bằng 0 :-).
whuber

@whuber, vâng, cũng vậy :)
mpiktas

Xin chào, tôi không hiểu tại sao giả định này? Ai đó có thể giải thích điều đó không?
Mvkt

1
μiμiiμTôi
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.