Điều này được trích dẫn rất thường xuyên khi đề cập đến lời nguyền của chiều và đi
(công thức tay phải gọi là tương phản)
Kết quả của định lý cho thấy rằng sự khác biệt giữa khoảng cách tối đa và tối thiểu đến một điểm truy vấn nhất định không tăng nhanh như khoảng cách gần nhất với bất kỳ điểm nào trong không gian chiều cao. Điều này làm cho một truy vấn gần như vô nghĩa và không ổn định vì có sự phân biệt đối xử kém giữa người hàng xóm gần nhất và xa nhất.
Tuy nhiên, nếu người ta thực sự thử tính độ tương phản cho các giá trị mẫu, nghĩa là người ta lấy một vectơ chứa các giá trị rất nhỏ và tính khoảng cách đến vectơ 0 và thực hiện tương tự cho một vectơ chứa các giá trị lớn hơn nhiều, và sau đó so sánh các giá trị cho kích thước 3 và kích thước lớn hơn lần, người ta sẽ thấy rằng, trong khi tỷ lệ giảm, thì sự thay đổi nhỏ đến mức không liên quan đến số lượng kích thước thực sự được sử dụng trong thực tế (hoặc có ai biết ai làm việc không với dữ liệu có kích thước bằng số của Graham - mà tôi đoán là kích thước cần thiết cho hiệu ứng được mô tả để thực sự có liên quan - tôi nghĩ là không).
Như đã đề cập trước đây, định lý này rất thường được viện dẫn để ủng hộ tuyên bố rằng đo lường sự gần gũi dựa trên không gian euclide là một chiến lược kém trong không gian chiều cao, các tác giả tự nói như vậy, và hành vi được đề xuất không thực sự xảy ra, khiến tôi nghĩ rằng định lý này đã được sử dụng một cách sai lệch.
Ví dụ: với d
kích thước
a=np.ones((d,)) / 1e5
b=np.ones((d,)) * 1e5
dmin,dmax=norm(a), norm(b)
(dmax-dmin)/dmin
cho d = 3
9999999999.0
cho d = 1e8
9999999998.9996738
Và với 1e1 thay vì 1e5 (giả sử dữ liệu được chuẩn hóa)
cho d = 3
99.0
cho d = 1e8
98.999999999989527