Giới thiệu và ký hiệu:
Đây là một phiên bản mới và đơn giản của thuật toán của tôi dường như chấm dứt (theo thí nghiệm của tôi), và bây giờ tôi muốn chứng minh điều đó.
Đặt ký hiệu tham chiếu đến điểm dữ liệu p chiều (vectơ). Tôi có ba bộ A, B và C, sao cho | Một | = n , | B | = m , | C | = l :
A = { x i | i = 1 , . . , n } B = { x j | j = n + 1xi∈Rpp|A|=n|B|=m|C|=l
A={xi|i=1,..,n}
C = { x u | u = n + m + 1 , . . , n + m + l }B={xj|j=n+1,..,n+m}
C={xu|u=n+m+1,..,n+m+l}
Với , chúng ta hãy d Một x i biểu thị khoảng cách Euclide bình từ x i để nó k gần điểm trong Một ; và d C x i biểu thị khoảng cách Euclide bình từ x i để nó k gần điểm trong C .k∈N∗dAxixikAdCxixikC
Thuật toán:
ABBCACB
- A′={xi∈A∣dAxi>dCxi}
- A=A∖A′B=B∪A′
- B′={xi∈B∣dAxi<dCxi
- B=B∖B′A=A∪B′
- ABBA|A|≤k|B|≤k
Thuật toán chấm dứt trong hai trường hợp:
- |A||B|k
- A′=B′=∅
Câu hỏi:
∑x∈AdCx+∑x∈BdAx∑x∈AdAx+∑x∈BdCx∑x∈AdAx+∑x∈BdBx∑x∈AdBx+∑x∈BdAx
Ghi chú:
- kxSkxSxk=1
- A,B,C∀xi∈B,xj∈Axb∈Cxixa∈Cxjdistance(xi,xb)<distance(xj,xa)BCA
- ABABA′B