Đồ thị nhúng là gì?


12

Gần đây tôi đã bắt gặp các đồ thị nhúng như DeepWalk và LINE. Tuy nhiên, tôi vẫn chưa có ý tưởng rõ ràng về ý nghĩa của việc nhúng đồ thị và khi nào nên sử dụng nó (ứng dụng)? Mọi góp ý đều được chào đón!


1
Một đồ thị nhúng là một nhúng cho đồ thị! Vì vậy, nó lấy một biểu đồ và trả về các nhúng cho biểu đồ, các cạnh hoặc các đỉnh. Các nhúng cho phép tìm kiếm tương tự và thường tạo điều kiện cho việc học máy bằng cách cung cấp các biểu diễn .
Emre

@Emre có nghĩa là gì khi nhúng? :)
Volka

1
Như ý nghĩa của nhúng đi, sửa chữa mọi thứ vào một cái gì đó. Nhúng đồ thị là loại giống như cố định các đỉnh trên một bề mặt và vẽ các cạnh để thể hiện một mạng. Vì vậy, ví dụ như đồ thị phẳng có thể được nhúng vào bề mặt mà không có cạnh chéo. Trọng lượng có thể được gán cho các cạnh và độ dài cạnh thích hợp viz. giúp chúng tôi hiểu / ước tính như @Emre đã đề cập đến tìm kiếm tương tự, v.v.2D
Kiritee Gak

@KiriteeGak Cảm ơn :) Ứng dụng trong thế giới thực của họ là gì? Họ nói rằng họ có thể được sử dụng cho khuyến nghị và tất cả? nhưng bằng cách nào?
Volka

1
Đề xuất video Youtube có thể được hình dung như một mô hình mà video bạn đang xem là nút bạn đang xem và các video tiếp theo trong đề xuất của bạn là những video tương tự với bạn dựa trên những gì người dùng tương tự đã xem tiếp theo và nhiều nhiều yếu tố hơn tất nhiên là một mạng lưới lớn để vượt qua. Bài viết này là một đơn giản tốt đọc về sự hiểu biết ứng dụng.
Kiritee Gak

Câu trả lời:


18

Việc nhúng đồ thị học cách ánh xạ từ mạng sang không gian vectơ, trong khi vẫn bảo tồn các thuộc tính mạng có liên quan.

Không gian vectơ phù hợp với khoa học dữ liệu hơn đồ thị. Đồ thị chứa các cạnh và nút, các mối quan hệ mạng đó chỉ có thể sử dụng một tập hợp con cụ thể của toán học, thống kê và học máy. Không gian vectơ có bộ công cụ phong phú hơn từ các miền đó. Ngoài ra, các phép toán vectơ thường đơn giản và nhanh hơn các phép toán đồ thị tương đương.

Một ví dụ là tìm hàng xóm gần nhất. Bạn có thể thực hiện "bước nhảy" từ nút này sang nút khác trong biểu đồ. Trong nhiều biểu đồ trong thế giới thực sau một vài bước nhảy, có rất ít thông tin có ý nghĩa (ví dụ: đề xuất từ ​​bạn của bạn của bạn bè). Tuy nhiên, trong không gian vectơ, bạn có thể sử dụng các số liệu khoảng cách để có được kết quả định lượng (ví dụ: khoảng cách Euclidian hoặc Tương tự Cosine). Nếu bạn có số liệu khoảng cách định lượng trong một không gian vectơ có ý nghĩa, việc tìm hàng xóm gần nhất là điều đơn giản.

" Các kỹ thuật, ứng dụng và hiệu suất nhúng đồ thị: Khảo sát " là một bài viết tổng quan đi sâu vào chi tiết hơn.


24

Đồ thị nhúng là gì? "Đồ họa nhúng" là một lĩnh vực nóng hiện nay trong học máy. Về cơ bản, nó có nghĩa là tìm "biểu diễn vectơ tiềm ẩn" của các biểu đồ nắm bắt cấu trúc liên kết (theo nghĩa rất cơ bản) của biểu đồ. Chúng ta có thể làm cho "biểu diễn vectơ" này trở nên phong phú bằng cách xem xét các mối quan hệ đỉnh-đỉnh, thông tin cạnh, v.v. Có khoảng hai cấp độ nhúng trong biểu đồ (tất nhiên chúng ta có thể xác định nhiều cấp độ hơn bằng cách chia logic toàn bộ biểu đồ thành biểu đồ con có kích thước khác nhau):

  • Vertex Embeddings - Ở đây bạn tìm thấy biểu diễn vectơ tiềm ẩn của mọi đỉnh trong biểu đồ đã cho. Sau đó, bạn có thể so sánh các đỉnh khác nhau bằng cách vẽ các vectơ này trong không gian và các đỉnh "tương tự" thú vị được vẽ gần nhau hơn so với các đỉnh khác nhau hoặc ít liên quan hơn. Đây là công việc tương tự được thực hiện trong "DeepWalk" của Perozzi.
  • Đồ thị nhúng - Ở đây bạn tìm thấy biểu diễn vectơ tiềm ẩn của toàn bộ biểu đồ. Ví dụ: bạn có một nhóm các hợp chất hóa học mà bạn muốn kiểm tra xem các hợp chất nào giống nhau, có bao nhiêu loại hợp chất trong nhóm (cụm), v.v. Bạn có thể sử dụng các vectơ này và vẽ chúng trong không gian và tìm tất cả các thông tin trên Đây là công việc được thực hiện trong "Deep Graph Kernels" của Yanardag.

Ứng dụng - Bằng cách xem xét cẩn thận, các nhúng là các biểu diễn "tiềm ẩn" có nghĩa là nếu biểu đồ có | V | * | V | ma trận kề trong đó | V | = 1M, thật khó để sử dụng hoặc xử lý số 1M * 1M trong thuật toán. Vì vậy, việc nhúng kích thước tiềm ẩn 'd', trong đó d << | V |, sẽ tạo ra ma trận kề | V | * d và tương đối dễ sử dụng hơn. Một ứng dụng khác có thể là - Hãy xem xét một kịch bản đơn giản trong đó chúng tôi muốn giới thiệu sản phẩm cho những người có cùng sở thích trong mạng xã hội. Bằng cách lấy các đỉnh nhúng (ở đây có nghĩa là biểu diễn vectơ của mỗi người), chúng ta có thể tìm thấy các vectơ tương tự bằng cách vẽ các vectơ này và điều này làm cho khuyến nghị dễ dàng. Đây là một số ứng dụng và có những ứng dụng khác. Bạn có thể tham khảo một bài khảo sát hay - Kỹ thuật nhúng đồ thị, khảo sát .

Tất cả từ đâu đến? Đã có rất nhiều công trình trong lĩnh vực này và gần như tất cả đều đến từ nghiên cứu đột phá trong lĩnh vực xử lý ngôn ngữ tự nhiên - "Word2Vec" của Mikolov. Nếu bạn muốn bắt đầu với nghiên cứu về nhúng đồ thị, trước tiên tôi khuyên bạn nên hiểu cách hoạt động của Word2Vec. Bạn có thể tìm thấy những lời giải thích hay - học về tham số Word2VecBài giảng Stanford . Sau đó, bạn có thể chuyển đến các giấy tờ mà bạn liệt kê. Những tác phẩm có thể được phân loại như:


2
Ồ Đây hoàn toàn là một câu trả lời hoàn hảo. Cảm ơn rất nhiều :) Làm rất tốt :)
Volka

Xin chào Mausam Jain. Bạn có thể vui lòng cho tôi biết nếu tôi có thể sử dụng các biểu đồ nhúng để xác định các nút quan trọng trong mạng không?
Volka

Xin chào, Volka. Để trả lời câu hỏi này, tôi cần biết bạn đang làm việc với loại biểu đồ nào; đó là twitter, facebook, reddit hay cái gì khác?
bayDope

Cảm ơn bạn đã trả lời của bạn. Tôi thực sự đang làm việc trong một mạng xã hội nơi tôi muốn xác định những người xã hội nhất :)
Volka

0

Trong bài báo Một định lý giới hạn trung tâm cho một omnibus nhúng các đồ thị sản phẩm chấm ngẫu nhiên của Levin et.al. giấy, một loại nhúng đồ thị cụ thể (nhúng Omnibus) định nghĩa nhúng đồ thị là một phương pháp "trong đó các đỉnh của đồ thị được ánh xạ tới các vectơ trong không gian Euclide chiều thấp." Kiểm tra liên kết để biết thêm thông tin.


chào mừng bạn đến với diễn đàn. Nếu bạn muốn đề cập đến một bài báo, xin vui lòng viết tên của nó như là một phần của văn bản (vì các liên kết có thể bị phá vỡ).
Mark.F 29/12/18
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.