Điểm số khoảng cách và tương tự Euclide


13

Tôi chỉ làm việc với cuốn sách Trí tuệ tập thể (của Toby Segaran) và tình cờ thấy điểm số khoảng cách Euclide. Trong cuốn sách, tác giả chỉ ra cách tính điểm tương đồng giữa hai mảng khuyến nghị (tức là .person×moviescore)

Anh ta tính khoảng cách Euclide cho hai người và theo p1p2

d(p1,p2)=i  item(sp1sp2)2

Điều này làm cho hoàn toàn có ý nghĩa với tôi. Điều tôi không thực sự hiểu là tại sao anh ta tính toán vào cuối những điều sau đây để có được "sự tương đồng dựa trên khoảng cách":

11+d(p1,p2)

Vì vậy, bằng cách nào đó tôi nhận ra rằng đây phải là sự chuyển đổi từ khoảng cách sang sự tương đồng (phải không?). Nhưng tại sao hình thức trông như thế này? Ai đó có thể giải thích điều đó?


Có thể có nhiều cách để chuyển đổi sự khác biệt và tương đồng với nhau - công thức cụ thể phụ thuộc vào ý nghĩa của bạn và cho phân tích trong tương lai. Trong sách giáo khoa đó, tác giả thích công thức bạn trình bày vì một số lý do; người khác trong một tình huống khác có thể chọn một công thức khác. Cách chính xác nhất về mặt hình học để chuyển đổi khoảng cách euclide thành tương tự sẽ theo định lý cosine trong điều kiện tập trung vào dữ liệu và được mô tả ở đây ngang bằng. 1.
ttnphns 23/03/13

Đồng ý! Nhưng nếu tôi hiểu đúng, bạn không thực sự chuyển đổi khoảng cách euclide thành tương tự, nhưng bạn chỉ sử dụng một hàm khác trả về giá trị của bạn trong vòng 0 và 1 (vì cosin), phải không? Ý tôi là nó có vẻ khác với tôi so với việc tính toán tất cả các khoảng cách và sau đó chuyển đổi chúng thành một điểm tương đồng bằng cách ví dụ nội suy giữa khoảng cách nhỏ nhất và lớn nhất. Đúng?
hải quân

Nếu bạn có một ma trận đối xứng vuông của khoảng cách euclide bình phương và bạn thực hiện thao tác "định tâm kép" trên đó thì bạn sẽ có được ma trận của các sản phẩm vô hướng sẽ được quan sát khi bạn đặt nguồn gốc của không gian euclide vào giữa cấu hình của bạn các đối tượng. Các sản phẩm vô hướng này là điểm tương đồng kiểu góc. Họ rất giống hiệp phương sai . Chúng không bị ràng buộc trong phạm vi 0-1, chúng có thể là các phần tử âm, dương và chéo không nhất thiết là 1. Tuy nhiên, chúng là những điểm tương đồng.
ttnphns

Câu trả lời:


12

Nghịch đảo là thay đổi từ khoảng cách đến tương tự.

Số 1 trong mẫu số là làm cho nó sao cho giá trị tối đa là 1 (nếu khoảng cách là 0).

Căn bậc hai - Tôi không chắc chắn. Nếu khoảng cách thường lớn hơn 1, gốc sẽ làm cho khoảng cách lớn ít quan trọng hơn; nếu khoảng cách nhỏ hơn 1, nó sẽ làm cho khoảng cách lớn trở nên quan trọng hơn.


Lấy làm tiếc! Căn bậc hai đã sai. Tác giả thực sự đặt nó trong công thức thứ hai, nhưng bỏ nó trong công thức đầu tiên. Vì vậy, nó không nên ở đó
hải quân

Có, nhưng gợi ý của bạn với việc đặt giá trị tối đa thành 1 có ý nghĩa! Cảm ơn!
hải quân

4

Để đo khoảng cách và độ tương tự (theo nghĩa ngữ nghĩa), điều đầu tiên cần kiểm tra là bạn có di chuyển trong không gian Euclide hay không. Một cách thực nghiệm để xác minh điều này là ước tính khoảng cách của một cặp giá trị mà bạn biết ý nghĩa.


1

Như bạn đã đề cập, bạn biết cách tính khoảng cách Euclidence nên tôi đang giải thích công thức thứ hai.

Công thức Euclide tính toán khoảng cách, sẽ nhỏ hơn cho những người hoặc vật phẩm giống nhau hơn. Giống như nếu chúng giống nhau thì khoảng cách là 0 và hoàn toàn khác nhau sau đó cao hơn 0.

Tuy nhiên, chúng ta cần một hàm cho giá trị cao hơn của chúng tương tự nhau. Điều này có thể được thực hiện bằng cách thêm 1 vào hàm (vì vậy bạn không gặp lỗi chia cho 0) và đảo ngược nó. Giống như nếu khoảng cách 0 và điểm tương tự 1/1 = 1


Tôi không hiểu câu trả lời này.
Michael R. Chernick

ok giả sử khoảng cách Euclide giữa mục 1 và mục 2 là 4 và giữa mục 1 và mục 3 là 0 (có nghĩa là chúng giống nhau 100%). Đây là khoảng cách của các vật phẩm trong một không gian ảo. nhỏ hơn giá trị khoảng cách có nghĩa là chúng ở gần nhau có nghĩa là có nhiều khả năng tương tự nhau. Bây giờ chúng tôi muốn giá trị số sao cho nó có số cao hơn nếu chúng giống nhau nhiều. Vì vậy, chúng ta có thể nghịch đảo giá trị khoảng cách. Nhưng nếu chúng ta có khoảng cách là 0 thì tại sao chúng ta thêm 1 vào mẫu số. vì vậy điểm tương tự cho mục 1 và 2 là 1 / (1 + 4) = 0,2 và cho mục 1 và mục 3 là 1 / (1 + 0) = 0
user10009133

Có thể bạn đang nói về một số loại đo khoảng cách nhưng khoảng cách Euclide tuân theo một công thức cụ thể liên quan đến một không gian vectơ.
Michael R. Chernick

1/1+d(p1,p2)
user10009133
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.