Những khó khăn gốc trong việc đi từ đồ thị đến siêu dữ liệu là gì?


10

Có rất nhiều ví dụ trong tổ hợp và khoa học máy tính nơi chúng ta có thể phân tích một vấn đề lý thuyết đồ thị nhưng đối với tương tự siêu đồ thị của vấn đề, các công cụ của chúng ta còn thiếu. Tại sao bạn nghĩ rằng các vấn đề thường trở nên khó khăn hơn nhiều so với các siêu đồ thị 3 đồng nhất so với các đồ thị trên 2 đồng nhất? Những khó khăn gốc là gì?

Một vấn đề là chúng ta chưa có một sự hiểu biết thỏa đáng về lý thuyết siêu âm phổ. Xin vui lòng làm sáng tỏ hơn về vấn đề này. Nhưng tôi cũng đang tìm kiếm những lý do khác làm cho siêu dữ liệu trở thành đối tượng khó khăn hơn.


Tôi tự hỏi mức độ này có liên quan đến mức độ nào liên quan đến cuộc thảo luận gần đây về sự thay đổi độ phức tạp của các vấn đề hình học chuyển từ 2D sang 3D ( cstheory.stackexchange.com/questions/5251/ trộm ). Lý do tôi nói điều này là vì bạn có thể liên kết các cạnh trong đồ thị 2 đồng nhất với các vị trí trên mạng 2D, trong khi siêu đồ thị 3 đồng nhất sau đó sẽ có các siêu cạnh tương ứng với các vị trí trong mạng 3d.
Joe Fitzsimons

@Joe Fitzsimons: điểm tốt. Nhưng các khái niệm và kỹ thuật tự nhiên trong cài đặt đồ thị (siêu), chẳng hạn như đồ thị con, màu, phân vùng, v.v., có thể không tự nhiên trong cài đặt hình học. Ngoài ra, tôi đồng ý với bạn rằng có một quá trình chuyển đổi "hai thành ba" trong nhiều lĩnh vực.
arnab

2
Câu hỏi của bạn rất khó vì một câu trả lời thỏa đáng sẽ giải quyết vấn đề P vs NP. Lưu ý rằng kết hợp hoàn hảo dễ dàng đối với đồ thị 2 đồng nhất trong khi khó đối với siêu đồ thị 3 đồng nhất.
Mohammad Al-Turkistany

Là siêu dữ liệu một khái niệm được xác định rõ? (Đối với một điều mà trình kiểm tra chính tả trang web này không biết về nó :-) Đây có phải là mối quan hệ của mức độ cố định hoặc biến đổi không?
Tegiri Nenashi

Ok, sau khi truy cập wikipedia, tôi thấy rằng nó không thực sự là một mối quan hệ, mà là một bộ các bộ. Toán học chính thống có coi trọng khái niệm "siêu dữ liệu" này không?
Tegiri Nenashi

Câu trả lời:


8

Trong câu hỏi này tôi hiểu "khó khăn" không phải là "khó tính toán", mà là "khó học".

Các vấn đề về đồ thị dễ dàng hơn (ít nhất là đối với tôi) để nghiên cứu vì một số khái niệm xảy ra tương đương nhau. Nói cách khác, nếu bạn muốn khái quát hóa các câu hỏi cho biểu đồ cho các biểu đồ cho siêu dữ liệu, bạn cần chú ý đến khái quát hóa "đúng" để có thể thu được kết quả mong muốn.

Ví dụ, hãy xem xét một cái cây. Đối với biểu đồ, biểu đồ là một cây nếu nó được kết nối và không chứa chu kỳ. Điều này tương đương với việc được kết nối và có các cạnh n-1 (trong đó n là số đỉnh) và cũng tương đương với việc không chứa chu kỳ và có các cạnh n-1. Tuy nhiên, đối với siêu dữ liệu 3 đồng nhất, giả sử siêu dữ liệu 3 đồng nhất là một cây nếu nó được kết nối và không chứa chu kỳ. Nhưng, điều này không tương đương với việc được kết nối và có các siêu tăng n-1, cũng như không chứa chu kỳ và có các siêu tăng n-1.

Tôi đã nghe thấy một khó khăn chính để chứng minh bổ đề đều đặn cho siêu dữ liệu thống nhất là đưa ra các định nghĩa đúng về tính đều đặn và các khái niệm liên quan.

Khi bạn muốn xem xét "lý thuyết siêu âm phổ", bạn có thể cố gắng xem xét các tenxơ hoặc tương đồng nếu bạn thấy một siêu đồ đồng nhất k là một phức đơn giản hai chiều (k-1), từ đó đại số tuyến tính tự nhiên phát sinh. Tôi không biết đâu là khái quát "đúng" cho mục đích của bạn, hoặc có thể là không đúng.


7

Tôi nghĩ rằng điều này phần lớn là do "sức mạnh thần bí của twoness" của Lawler (quan sát rằng nhiều vấn đề được tham số hóa nằm ở P cho param = 2 và NP-hoàn thành cho param≥3). Đồ thị là một thứ kết nối 2 tuples của đỉnh và siêu đồ thị là thứ kết nối k-tuples của các đỉnh cho k≥3.

Vì vậy, ví dụ, 2-SAT nằm trong P và về cơ bản là một vấn đề về đồ thị, trong khi 3-SAT là một vấn đề trên siêu dữ liệu 3 đồng nhất và hoàn thành NP.


1
Nói chính xác hơn, tôi muốn hỏi liệu người ta có thể xác định một số lý do cơ bản tại sao các kỹ thuật lý thuyết đồ thị bị phá vỡ không. Ví dụ: chúng tôi thực sự không có các phương pháp đại số tuyến tính cho siêu dữ liệu vì thứ hạng tenor không được hiểu rõ (ví dụ: NP-khó tính toán).
arnab

1
Mục đích của câu trả lời của tôi không phải là "những vấn đề này khó giải quyết cho máy tính" mà là có mối tương quan chặt chẽ giữa P / NPC và có / không có các đặc tính toán học hay. Vì vậy, các vấn đề trở nên khó khăn hơn để nghiên cứu song song với việc trở thành NPC của họ.
David Eppstein

7
Trong bối cảnh này, câu hỏi được đăng gần đây cstheory.stackexchange.com/questions/14950/ Lời khá thú vị: Nhận biết biểu đồ đường của 2 siêu đồ thị, tức là biểu đồ đường của đồ thị (đa), trong P, trong khi nhận ra biểu đồ đường của 3 siêu dữ liệu dường như là một vấn đề mở. Cũng lưu ý rằng vấn đề đặc tính hóa cho 3 siêu dữ liệu (bởi các sơ đồ con bị cấm) vẫn còn mở, trong khi biểu đồ đường của đồ thị (đa) thừa nhận một số đặc tính như vậy.
vb le

5

Một lý do khác là chúng ta có nhiều kiến ​​thức về quan hệ nhị phân hơn bất kỳ mối quan hệ n-ary nào khác cho n lớn hơn 2.

Đương nhiên, chúng tôi xem xét mối quan hệ nhị phân giữa các đối tượng, như kề, giao nhau, không tương đương, v.v. Vì vậy, chúng tôi có thể định nghĩa biểu đồ theo quan hệ nhị phân và thậm chí xác định biểu đồ dựa trên một số quan hệ nhị phân trên biểu đồ khác. (Ví dụ: biểu đồ đường, cây phân nhánh, phân rã cây ...)

Nhưng đối với các mối quan hệ n-ary khác, chúng tôi không có nhiều hiểu biết. Ví dụ, phải mất một thời gian để đưa ra một mối quan hệ ternary thú vị; (Được rồi, một phần do sự thiếu hiểu biết của tôi) các thuộc tính yếu hơn và các công cụ ít hơn nhiều trong nghiên cứu về quan hệ ternary. (Làm thế nào để chúng ta xác định đối xứng hay bắc cầu quan hệ ternary? Cả hai đều là một trong những mối quan hệ quan trọng nhất người ta có thể nghiên cứu.)

Nhưng tôi vẫn không biết tại sao điều này xảy ra giữa quan hệ nhị phân và ternary. Có thể như Turkistany đã nói câu hỏi này rất khó và có thể liên quan đến sự hiểu biết về vấn đề P / NP.


[Đại số hình trụ và đa âm mặc dù] không có đại số hấp dẫn cho mối quan hệ n-ary. Cuộc tranh luận thậm chí có thể được hạ xuống mức khi một người tranh luận về quan điểm vị trí so với quan điểm được đặt tên với các thuộc tính quan hệ.
Tegiri Nenashi

2

Lần đầu tiên tôi sẽ trả lời câu hỏi sai: "ví dụ nào về các vấn đề khó hơn trong siêu đồ thị so với đồ thị". Tôi đặc biệt ấn tượng bởi sự khác biệt trong việc xử lý vấn đề khớp tối đa trong đồ thị, và tương tự với siêu đồ thị (một tập hợp các cạnh tách rời nhau), rất dễ có thể mô hình hóa màu, tập độc lập tối đa, cụm sao tối đa ...

Sau đó, tôi nhận thấy đó không phải là câu hỏi của bạn: "những khó khăn gốc rễ giữa hai người là gì?".

Chà, đến lúc đó tôi sẽ trả lời rằng cho đến giờ tôi vẫn chưa thấy nhiều điểm chung giữa đồ thị và siêu đồ thị. Ngoại trừ tên của chính nó. Và thực tế là rất nhiều người đang cố gắng "mở rộng" kết quả từ lần đầu tiên đến kết quả khác.

Tôi đã có dịp lật các trang của "Siêu hệ thống" của Berge và "Hệ thống thiết lập" của Bollobas: chúng chứa nhiều kết quả ngon và những cái tôi thấy thú vị nhất có thể nói về đồ thị. Ví dụ định lý của Baranyai (có một bằng chứng hay trong cuốn sách của Jukna).

Tôi không biết nhiều về họ nhưng tôi đang nghĩ về một vấn đề siêu dữ liệu ngay bây giờ và tất cả những gì tôi có thể nói về nó là tôi không cảm thấy bất kỳ biểu đồ nào ẩn giấu ở bất cứ đâu xung quanh. Có lẽ chúng tôi nghĩ về chúng là "khó khăn" bởi vì chúng tôi chỉ đang cố gắng nghiên cứu chúng với các công cụ sai. Tôi không mong đợi các vấn đề đồ thị tôi đang làm việc sẽ biến mất ngay lập tức bằng cách sử dụng lý thuyết số (mặc dù đôi khi nó xảy ra).

Ồ, và một cái gì đó khác. Có lẽ chúng khó học hơn vì chúng kết hợp nhiều .... nhiều hơn?!

"Hãy thử tất cả và xem khi nào nó hoạt động" đôi khi là một ý tưởng tốt cho đồ thị, nhưng với siêu dữ liệu, nó nhanh chóng bị hạ thấp bởi các con số. :-)

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.