Thư viện tri thức trực tuyến
Kho tài liệu với 50,000+ tài liệu học thuật
© 2023 Siêu thị PDF - Kho tài liệu học thuật hàng đầu Việt Nam

Bài giảng web ngữ nghĩa căn bản
Nội dung xem thử
Mô tả chi tiết
1. Web ngữ nghĩa là gì?
Tim Berners-Lee: Web có ngữ nghĩa là sự mở rộng của WEB hiện tại mà trong đó
thông tin được định nghĩa rỏ ràng sao cho con người và máy tính có thể cùng làm
việc với nhau một cách hiệu quả hơn. (Được định nghĩa để máy tính xử lý được,
tích hợp DL động; DL/tri thức được sử dụng lại thông qua các ứng dụng khác
nhau)
Theo định nghĩa của Tổ chức World Wide Web (W3C): “WebNN là một cách
nhìn về cách thức tổ chức dữ liệu: đó là ý tưởng về việc dữ liệu trên Web được
định nghĩa và liên kết theo một cách mà nó có thể được sử dụng bởi máy tính với
mục đích không chỉ cho việc hiển thị mà còn tự động hoá, tích hợp và sử dụng lại
dữ liệu qua các ứng dụng khác nhau”.
⇒Phân biệt WebNN với Trí tuệ nhân tạo: TTNT là làm cho máy tính thông
minh hơn còn WebNN là làm cho ứng dụng thông minh hơn (Biểu diễn thông tin,
DL theo cách nào đó để ứng dụng có thể hiêu được)
⇒Tại sao cần đến WebNN: Vấn đề chính với Web hiện nay là nội dung web
thiếu ngữ nghĩa, dẫn đến việc tìm kiếm DL trên web chủ yếu dựa vào keyword và
theo đó là:
-Tìm ra nhiều kết quả→tính chính xác thấp
-Không có kết quả nếu tìm quá chặt chẽ
-Kq rất phụ thuộc vào sự “nhạy cảm” của từ ngữ
-Người sử dụng phải tốn nhiều thời gian, công sức để xử lý kết quả trả về.
→Nói chung thao tác chủ yếu là thao tác trên nội dung thấy được. Quan trọng là
máy tính không hiểu được ngữ nghĩa của DL.
2. Kiến trúc của WebNN
Trong đó:
-Unicode và URI: cơ sở để xây dựng các tài liệu
-XML+NS+XMLschema: Công nghệ xây dựng tài liệu bán cấu trúc
-RDF và RDFs: mô tả siêu DL trên WebNN
-Ontology vocabulary: Mô tả các quan hệ cũng như các khái niệm trong miền ứng
dụng.
-Logic: Cơ sở để chuẩn hóa các khái niệm cho WebNN
-Proof và Trust: Là các ứng dụng cao cấp mà WebNN muốn đạt đến cho Web hiện
tại.
Trong đó:
-Unicode và URI: cơ sở để xây dựng các tài liệu
-XML: công nghệ xây dựng tài liệu bán cấu trúc.
-RDF: Chuẩn trao đổi siêu DL WebNN
-Ontology (RDFs, OWL) và ngôn ngữ các luật: Mô tả các quan hệ cũng như các
khái niệm trong miền ứng dụng và suy diễn của chúng.
+SPARQL: ngôn ngữ truy vấn cho DL RDF và ontology
-Đồng nhất về logic: cơ sở để chuẩn hóa các khái niệm cho WebNN
-Proof và Trust: Là các ứng dụng cao cấp mà WebNN muốn đạt đến ho web hiện
tại.
-Tầng trên cùng: Giao diện người dùng và các ứng dụng.
Giải thích chi tiết:
Từ sơ đồ kiến trúc của Web ngữ nghĩa, ta thấy có bảy tầng kiến trúc. Trong đó, với
hệ thống Web hiện tại (World Wide Web) là đang ở tầng thứ hai.
Unicode: là một bảng mã chuẩn chung có đủ các ký tự để thống nhất sự giao tiếp
trên tất cả các quốc gia, đáp ứng tính nhất quán toàn cầu của web.
URI (Uniform Resource Identifier): là kí hiệu nhận dạng Web đơn giản. Cụ thể,
nó là một xâu ngắn cho phép nhận dạng tài nguyên Web như: với các xâu bắt đầu
với "http:" hoặc "ftp:" mà chúng ta thường thấy trên World Wide Web. Bất kỳ một
người nào cũng có thể tạo một URI, và sở hữu chúng và chúng là một công nghệ
cơ sở để xây dựng một hệ thống Web toàn cầu. Hệ thống World Wide Web được
xây dựng trên chúng và bất kỳ cái gì mà có một URI thì được coi là "trên Web".
URL (Uniform Resource Locator): là một dạng đặc biệt của URI, cụ thể nó là
một địa chỉ trên mạng.
(URI (Uniform Resource Identifier) có thể hiểu là một chuỗi định danh tài nguyên
trên mạng. Mỗi một nguồn tài nguyên trên mạng sẽ có một địa chỉ duy nhất xác
định nó, đó chính là URI. Một dạng thức quen thuộc của URI là URL (Uniform
Resource Locator) được sử dụng để định danh một địa chỉ Web nào đó trên
Internet. Nói theo cách khác, URI là sự mở rộng của URL.)
RDF (Resource Description Framework): Khung mô tả tài nguyên - RDF được
W3C giới thiệu để cung cấp một cú pháp chuẩn để tạo, thay đổi và sử dụng các chú
thích trong Web ngữ nghĩa. Một mệnh đề RDF là một bộ ba có dạng: [chủđề
thuộctính đốitượng]. Trong đó, chủ đề là tài nguyên mà được mô tả bằng thuộc
tính và đối tượng. Thuộc tính thể hiện mối quan hệ giữa chủ đề và đối tượng. Còn
đối tượng ở đây có thể là một tài nguyên hoặc một giá trị. Ba thành phần trên trong
RDF đều là các URI.
RDFS (RDF schema): RDFS là một ngôn ngữ ontology đơn giản của web ngữ
nghĩa, được coi là một ngôn ngữ cơ sở của web ngữ nghĩa. RDFS là ngôn ngữ mô
tả bộ từ vựng trên các bộ ba RDF. Nó cung cấp các công việc sau:
- Định nghĩa các lớp tài nguyên
- Định nghĩa các quan hệ giữa các lớp
- Định nghĩa các loại thuộc tính mà các lớp trên có
- Định nghĩa các mối quan hệ giữa các thuộc tính.
Ontology Vocabulary: Bộ từ vựng ontology được xây dựng trên cơ sở tầng RDF
và RDFS, cung cấp biểu diễn ngữ nghĩa mềm dẻo cho tài nguyên web và có khả
năng hỗ trợ lập luận. Để xây dựng được các bộ từ vựng này, người ta đã sử dụng
các ngôn ngữ ontology để biểu diễn chúng như: RDFS, OIL, DAML, DAML+OIL,
OWL, ... Các ngôn ngữ này cung cấp khả năng biểu diễn và hỗ trợ lập luận khác
nhau và chúng dựa trên nền tảng là các ngôn ngữ logic mô tả tương ứng khác nhau.
Tầng Logic: Việc biểu diễn các tài nguyên dưới dạng các bộ từ vựng ontology có
mục đích là để máy có thể lập luận được. Mà cơ sở lập luận chủ yếu dựa vào logic.