Sự khác biệt giữa việc sử dụng RDFS / OWL so với XML là gì?


10

Tôi đã tự hỏi những lợi thế của các ngôn ngữ bản thể học của RDFS / OWL là gì khi sử dụng hệ thống gắn thẻ / đánh dấu (chẳng hạn như http://www.schema.org/ ) để quản lý và tạo siêu dữ liệu?


3
Động cơ suy luận, đó là những gì. Điều đáng ngạc nhiên là không có câu trả lời nào dưới đây nói về. Các động cơ như Jena có thể suy ra dữ liệu mới và sử dụng các thuộc tính bắc cầu.
Andrew T Finnell

2
@AndrewFinnell đăng một lời giải thích chi tiết hơn như một câu trả lời xin vui lòng

Andrew, tôi đồng ý và sẽ bỏ phiếu cho câu trả lời của bạn. Các câu trả lời hiện tại dưới đây là không có thông tin và chất lượng thấp.
Dibbeke

@AndrewFinnell, tôi cũng muốn bạn đăng câu trả lời của riêng bạn, tôi cũng tự hỏi liệu suy luận có vượt quá phạm vi của OP hay không. (Ban đầu tôi cũng nghĩ vậy, nhưng có lẽ không phải vậy)
ZJR

Câu trả lời:


5

Câu hỏi của bạn làm cho rất ít ý nghĩa như là. RDFS là một ngôn ngữ lược đồ rất cơ bản để diễn tả các ràng buộc RDF. OWL là lược đồ nâng cao hơn để thể hiện một bản thể luận phức tạp. Chúng hoàn toàn không có gì chung với XML ngoại trừ việc chúng có thể được thể hiện bằng XML.


4

Không thể trả lời nhiều hơn với câu trả lời của ZJR. Nó là hoàn toàn không hiểu biết.

  1. Làm thế nào để bạn phân tích Microdata? Nó phân tích cái gì quá? RDFa phân tích cú pháp thành RDF, một mô hình dữ liệu phổ biến, đó là điều mà Semantic Web đã khóc. Về cơ bản, Microdata xuất hiện vì Hickie không thể bận tâm đọc thông số kỹ thuật RDF và RDFa. Nó có thể dễ dàng hơn cho một nhà phát triển, nhưng nó không tốt hơn cho web (tức là lười biếng )
  2. Để xem danh sách các từ vựng OWL phổ biến, xem bên dưới:

  3. Bản phát hành tiếp theo của RDF sắp ra mắt, bao gồm các định dạng tuần tự hóa mới như Rùa và RDFj

  4. SPARQL 1.1 cũng sắp xảy ra. Liên kết truy vấn, biểu thức đường dẫn thuộc tính, Cập nhật SPARQL và nhiều hơn nữa.

  5. BBC được xây dựng trên RDF. API biểu đồ Facebook cung cấp RDF (đúng vậy, bạn có thể trì hoãn URI biểu đồ bằng tiêu đề Chấp nhận văn bản / rùa và lấy lại RDF) và nhiều tập đoàn lớn khác.

Vì vậy, tóm lại Semantic Web, RDF, RDFS, OWL, SPARQL và tất cả các tiêu chuẩn Web Semantic rất sống động và mạnh mẽ. Nếu bạn không tin tôi, hãy xem tất cả các hoạt động trên http://www.semanticoverflow.com


BBC được xây dựng trên RDF, mặc dù nó ánh xạ tới microdata, vì vậy? Họ đã xây dựng lại trang web trong thập kỷ 2000 - 2010 tại thời điểm W3C đang hứa hẹn các công cụ ma thuật tuyệt vời sẽ đến với RDF, những công cụ đó không thực sự thành hiện thực, RDF là di sản. Cấu trúc tổ chức vững chắc, nhưng khủng khiếp để chia sẻ, microdata bao gồm dặm cuối cùng. (và tiết kiệm trong ngày)
ZJR

và sau đó là một số: một SPARQL hữu ích sắp xuất hiện mãi mãi, từ ngữ của thông số RDF được sử dụng để hút thời gian lớn và khiến hầu hết những người triển khai tiềm năng sợ hãi trong nhiều năm. (dunno nếu họ đã sửa nó, họ đã sửa nó chưa? imho, quá muộn, dù sao đi nữa ) và sau đó, RDF<some-letter>danh pháp tạo ra sự nhầm lẫn và cãi nhau mọi lúc.
ZJR

1
BBC được xây dựng trên RDF bằng BigOWLIM, không phải microdata. Mircodata không phải là một định dạng dữ liệu chính tắc. Nó là một bổ sung cho HTML. Nền tảng Olympic mới được xây dựng hoàn toàn trên RDF, như đã đề cập trong các thông cáo báo chí và thuyết trình tại Học viện của họ.
William Greenly

4

RDF / OWL vs XML là thay thế sai. Trong thực tế, một trong những tuần tự hóa phổ biến là sử dụng XML.

Ngoài ra RDF / OWL vs microformats là thay thế sai. Trong thực tế, có các tiêu chuẩn cho phép sử dụng RDF như một microformat, RDFa chính thức của eRDFW3C với cách nhúng tiêu chuẩn vào HTML5 .

Vì vậy, thực sự câu hỏi là lợi thế của việc sử dụng các định dạng chuẩn, được phê duyệt W3C. Lý do là:

  • có rất nhiều bản thể học đã được đưa ra ngoài, bao gồm những bản được sử dụng rộng rãi nhất như Dublin CoreFOAF .
  • nhiều cửa hàng ba cửa tương thích với RDF / OWL cho hầu hết mọi ngôn ngữ lập trình.
  • nhiều cửa hàng ba cửa hàng đã đề cập ở trên có các công cụ suy luận với giao diện SPARQL .

Nhìn chung, tôi không thấy bất kỳ lý do nào tại sao bạn nên sử dụng microformat không chuẩn, không W3C.


1

RDFOWL được thiết lập các tiêu chuẩn để mã hóa dữ liệu ngữ nghĩa và lược đồ của chúng, ở mức độ sâu sắc và chung chung hơn nhiều so với đánh dấu đặc biệt.

Ví dụ, với OWL, bạn có thể xác định Lược đồ mới, ít nhất sẽ được hiểu bởi một phần bởi các công cụ khác (vì bạn có thể trộn các lược đồ OWL / RDF khác nhau với nhau). Bằng cách này, bạn có thể xuất từ ​​một tập dữ liệu "lượt xem" khác nhau về nó và nhờ mọi người hợp tác. Ngoài ra, bạn chỉ có thể "khám phá" các liên kết giữa các đối tượng và thuộc tính của chúng.

Với microdata, về cơ bản, đây là một tập hợp những thứ bạn có thể áp dụng, không phải là một nền tảng ngữ nghĩa chung.


Tôi vẫn còn bối rối về việc RDF khác với RDFS khác với OWL như thế nào .... Những thuật ngữ đó có thể được sử dụng thay thế cho nhau không ...?
Webster Thesaurus

@WebsterThesaurus RDF là một ngôn ngữ khá đơn giản để mô tả các khái niệm dựa trên bộ ba của Đối tượng-Động từ-Đối tượng. RDFS là Lược đồ RDF, về cơ bản là một tập hợp các thuật ngữ được xác định trước để giúp dễ dàng xác định ý nghĩa của các mối quan hệ. OWL là một hệ thống mô tả bản thể học, mạnh hơn nhiều so với RDFS, nhưng khó thực hiện hơn
p_l

1

Tôi muốn bắt đầu bằng cách lưu ý rằng câu trả lời này không được viết bởi một chuyên gia trong lĩnh vực này. Mặc dù tôi là người đề xuất các hệ thống phân tán ngữ nghĩa, tôi nghĩ rằng các ứng dụng của OWL hiện đang bị hạn chế. Mặc dù mô tả chính xác thị trường ngách mà OWL có thể được áp dụng sẽ vượt ra ngoài phạm vi của câu trả lời này, tôi có thể có thể đưa ra ánh sáng cho một số pro và con.

OWL về cơ bản là một ngôn ngữ cho phép biểu hiện các cấu trúc ngữ nghĩa bằng cách sử dụng phân loại, không giống như các lớp bạn biết từ OOP và các ràng buộc giữa các lớp và các thể hiện của chúng. Người ta có thể xem nó như một cách chính thức hơn và có thứ tự cao hơn để mô tả các mối quan hệ bạn biết từ cơ sở dữ liệu quan hệ.

Để mô tả và giao tiếp ngôn ngữ này, nó cần phải được tuần tự hóa sang một định dạng nhất định. Có một số định dạng, trong đó RDF chỉ là một.

Có ba cấp độ khác nhau của OWL, cho phép tăng tính biểu cảm, nhưng hạn chế khả năng tính toán (ví dụ: liệu bạn có thể tìm ra giải pháp khả thi cho các câu hỏi mà bạn hỏi về kiến ​​thức được mô tả theo định nghĩa của OWL không). Đây là OWL Lite, DL và Full.

Ưu điểm quan trọng nhất của việc sử dụng OWL / RDF là trao đổi kiến ​​thức giữa các cơ sở tri thức khác nhau (hoặc phân cấp phân loại) và tạo ra các suy luận hữu ích mà không cần phải thiết kế tất cả các cơ sở này trước để cho phép chúng giao tiếp. Điều này được thực hiện một phần bằng cách định nghĩa các lớp tương đương. Sử dụng không gian tên cho phép kỹ sư xác định tính duy nhất; một mô hình hữu ích.

Một lợi thế khác là số lượng công cụ suy luận và ngôn ngữ truy vấn ngày càng tăng. Trong thế giới nối mạng của chúng tôi, có nhu cầu trao đổi kiến ​​thức phân tán.

Có lẽ một nhược điểm quan trọng là độ phức tạp tương đối cao của việc xác định khả năng tính toán của các suy luận và các hạn chế về không gian và thời gian của chúng. Ví dụ. trong OWL đầy đủ, bạn có thể yêu cầu các suy luận không thể được chứng minh là chấm dứt. Vì vậy, chắc chắn có một giới hạn cho sức mạnh của OWL.

Kiến thức của OWL là rời rạc ... không có hệ thống nửa sự thật hay tin tưởng. Có những điều này rất có thể sẽ làm cho các giải pháp quá phức tạp.

Nhưng nhược điểm quan trọng nhất đối với sở thích của tôi là người ta không thể tìm thấy nhiều kỹ sư giỏi trong lĩnh vực này. Bạn sẽ cần một kỹ sư tri thức, một hoặc hai nhà khoa học máy tính và một nhóm phát triển nhỏ để xây dựng ngay cả một nền tảng kiến ​​thức nhỏ. Do đó, thường rẻ hơn và hiệu quả hơn khi chỉ sử dụng các ngôn ngữ mô tả như lược đồ XML và mô tả ngữ nghĩa cần thiết trong một tài liệu có thể đọc được.


0

RDFS là về mô tả dữ liệu có cấu trúc. Sẽ hữu ích hơn rất nhiều nếu nó bao gồm các phương thức hoặc hàm, vì vậy chúng ta có thể mô tả các giao diện với nó. Hiện tại bạn cần thêm một vocab để làm như vậy, ví dụ WSDL hoặc Hydra của dịch vụ web. Tôi đoán cũng có một vocab cho OOP, tôi chỉ không biết nhiều vocab.

OWL giống như XSD, đó là về việc xác thực dữ liệu của bạn, ví dụ: nếu bạn mong đợi một chuỗi có tối đa 20 ký tự, bạn sử dụng OWL để mô tả quy tắc đó và tạo trình xác thực. Về lý thuyết bạn có thể làm tương tự với RDFS và XSD, tôi không biết tại sao mọi người phải phát minh ra OWL thay vì chỉ sử dụng XSD. Có thể đó là do XSD không dựa trên RDFS, vì vậy, ví dụ chuỗi XSD không phải là hậu duệ của RDFS Literal.

Schema.org mô tả các lớp phổ biến như Person chẳng hạn. Họ tạo RDFS của riêng mình như vocab, bao gồm Thing thay vì rdfs: Class, domainIncludes thay vì rdfs: domain, RangeIncludes thay vì rdfs: Range, v.v. thay vì sử dụng RDFS. Các loại bị hạn chế của chúng cũng đặc biệt, chúng sử dụng Văn bản và Số mà không xác định chúng hoặc kết nối chúng ít nhất với rdfs: Nguyên văn hoặc XSD nguyên thủy. Họ không sử dụng XSD hoặc OWL để xác định các loại bị hạn chế theo như tôi có thể nói. Tôi không chắc có bất kỳ hạn chế nào trong vocab của họ không, nhưng nếu vậy tôi đoán họ đã đề cập đến nó trong phần mô tả có thể đọc được của con người, vì vậy bạn sẽ không thể tạo một trình xác nhận hợp lệ chống lại lược đồ.org, bạn có thể làm gì nếu họ sẽ sử dụng XSD / OWL và RDFS.

Vì vậy, tôi nghĩ rằng lợi thế của việc sử dụng các tiêu chuẩn như RDFS, XSD, OWL là bạn có thể viết các thư viện mà bạn có thể sử dụng lại theo từng tài liệu.


-2

Với mục đích phát triển các sản phẩm trong tương lai, các tệp XML RDFS / OWL sẽ bị coi là đã chết và biến mất.

Họ yêu cầu quá nhiều công việc để thể hiện các khái niệm rằng một giải pháp được xây dựng tùy chỉnh dựa trên các định dạng văn bản tùy chỉnh sẽ thể hiện tốt hơn , trong khi vẫn giữ dữ liệu dễ đọc hơn và có thể chỉnh sửa cho con người và máy móc. Họ không có giá trị thực sự và chỉ làm cho cuộc sống trở nên khốn khổ hơn một chút đối với mọi người vấp phải chúng. (và phải đối phó với danh pháp không gian tên của họ)

Tuy nhiên, có những giải pháp xử lý tài liệu khổng lồ dựa trên chúng, và chúng được phát triển, triển khai gần đây và đang phục vụ. Họ đe dọa sẽ nán lại trong một thời gian rất dài. Nhiều lập trình viên trong tương lai chắc chắn sẽ phải chịu đựng nhiều WTF do RDF và OWL quy định.

Các hệ thống Microdata , (phiên bản microformats thân thiện với trình xác nhận ) như các mô tả trong lược đồ.org , thay vào đó có rất nhiều lợi thế cho các nhà phát triển, biên tập viên và độc giả; cả con người và cơ khí.

Các khái niệm RDF (những giá trị tiết kiệm) có thể được ánh xạ (và thực sự được ánh xạ rõ ràng) qua các biểu diễn microdata một cách không đau đớn.

Các mục microdata cho phép các tác giả và hệ thống xử lý tài liệu làm phong phú thêm giao tiếp theo cách khá dễ dàng (dễ như CSS hoặc DOM) để xử lý và tùy chỉnh cho người đọc.


Đợi đã, tôi không hiểu ... vậy Microdata khác với XML / HTML như thế nào? Kế hoạch được mô tả trong lược đồ.org nói cụ thể họ sử dụng các thẻ bên trong trang web của họ ... không phải đó là những gì XML và HTML cũng làm sao?
Webster Thesaurus

Và nếu Microdata tốt hơn nhiều, tại sao W3C lại thúc đẩy RDFS / OWL mà không phải là Microdata?
Webster Thesaurus

Tôi nghĩ rằng câu trả lời đó khá sai lệch, như RDF! = XML. Mã hóa XML của RDF chỉ là một trong số rất nhiều và được thiết kế với mục đích trộn lẫn vào các Ứng dụng XML hiện có. Hơn nữa, quay trở lại các hệ thống tùy chỉnh (có, bao gồm cả microdata) có nghĩa là quay lại "viết trình phân tích cú pháp tùy chỉnh cho f * cking mọi thứ" thay vì có thể sử dụng từ vựng chung chung. Với RDF / OWL, tôi có thể kết hợp các ứng dụng khác nhau, mỗi ứng dụng hoạt động trên một tập hợp con dữ liệu liên quan, cũng như viết mã linh hoạt có phản xạ tự động - ví dụ điển hình là Xanasys LinkExplorer.
p_l

1
Câu trả lời không chính xác. Vui lòng hiển thị tài liệu tham khảo để sao lưu các yêu cầu này.
Dibbeke

@Dibbeke Dự đoán ban đầu của tôi là OP đang tìm kiếm metadatas thực dụng. RDF trong trường hợp đó là quá mức cần thiết. Phần được đề cập có liên quan đến niềm tin của tôi vào RDF luôn là một sự quá mức cần thiết .
ZJR
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.