Thư viện tri thức trực tuyến
Kho tài liệu với 50,000+ tài liệu học thuật
© 2023 Siêu thị PDF - Kho tài liệu học thuật hàng đầu Việt Nam

Ngôn ngữ Ngôn ngữ đánh dấu mở rộng XML docx
Nội dung xem thử
Mô tả chi tiết
Ngôn ngữ đánh dấu mở rộng
XML
TS. Nguyễn Thanh Bình
Chương trình
• Chương 1: XML – Ngôn ngữ đánh dấu
mở rộng
• Chương 2: DTD – Định nghĩa kiểu tài li
ệu
• Chương 3: XML Schema – Lược đồ XM
L
<chapter> 1</chapter>
<short> XML </short>
<long_en> Extensible Markup
Language</long_en>
<long_vn> Ngôn ngữ đánh dấu mở rộng
</long_vn>
<lecturer> Nguyễn Thanh Bình </lecturer>
Nội dung
• Mục đích:
– Giới thiệu một số nét chính về lịch sử của XML, phạm vi và
mục đích của XML và nội dung chính của môn học
• Nội dung chính của chương bao gồm:
– Giới thiệu tổng quan về ngôn ngữ đánh dấu và XML
• Lịch sử của việc đánh dấu và ngôn ngữ đánh dấu
• Sự phát triển của ngôn ngữ đánh dấu
• Kiến trúc 3 tầng của XML
• Các vùng ứng dụng của XML
• Các ưu điểm của XML và khi nào không cần đến XML
• Các công nghệ liên quan đến XML
– Tài liệu XML
• Các công cụ hỗ trợ
• Định dạng tài liệu XML
Giới thiệu
• XML (Extensible Markup Language): ngôn ngữ
đánh dấu mở rộng
• XML là một ngôn ngữ đánh dấu (markup
language) như HTML
• XML đã được thiết kế cho việc miêu tả dữ liệu
• Các thẻ XML không được định nghĩa trước.
• XML sử dụng định nghĩa kiểu dữ liệu
(Document Type Definition -DTD) hoặc lược đồ
XML (XML Schema) để miêu tả dữ liệu
• XML cùng với DTD hay XML Schema được thiết
kế để tự miêu tả dữ liệu
Tổng quan về XML
• Lịch sử của việc đánh dấu và ngôn ngữ
đánh dấu
• Sự phát triển của ngôn ngữ đánh dấu
• Kiến trúc 3 tầng của XML
• Các vùng ứng dụng của XML
• Các ưu điểm của XML và khi nào không
cần đến XML
• Các công nghệ liên quan đến XML
Lịch sử của việc đánh dấu
Documents recorded
using paper and pen
Typesetters formatting
documents
Tools used by typesetters
to format a document
Ngôn ngữ đánh dấu
• Một ngôn ngữ đánh dấu định nghĩa các luật,
các luật này dùng để mô tả nội dung và cấu
trúc của tài liệu.
• Chúng được phân loại như sau:
– Stylistic Markup – Xác định sự trình bày của tài
liệu
– Structure Markup – Định nghĩa cấu trúc của tài
liệu
– Semantic Markup – Xác định nội dung của tài liệu
Sự phát triển của ngôn ngữ đánh dấu
• Nguồn gốc của XML
– Hypertext
– Siêu ngôn ngữ dùng để chuyển đổi tài liệu
– WWW
• Hypertext bắt đầu từ 1945
– Tạo các đường dẫn để duyệt giữa các tài
liệu một cách ngẫu nhiên
• SGML dùng để quản lí tài liệu
• HTML được dùng cho www
SGML
• Generalized Markup Language (GML) là một
ngôn ngữ đánh dấu tài liệu tổng quát
• Standardized Generalized Markup Language
(SGML) :
– Là một siêu ngôn ngữ dùng để định nghĩa các
ngôn ngữ khác
– Có nguồn gốc từ GML
– Ý định chính là để hợp thức tài liệu
– Tách bạch giữa nội dung, cấu trúc và kiểu
– Tập trung vào cấu trúc và nội dung
– Tương tự như XML, nhưng phức tạp hơn
Điểm đặc trưng của SGML
• Miêu tả ngôn ngữ đánh dấu, cho phép
tạo các thẻ riêng liên quan đến nội
dung.
• Mục đích của SGML:
– Thể hiện chung tài liệu
– Cung cấp một số luật cho tập các tài liệu
(DTD)
• XML là một tập con của SGML
• HTML là một ứng dụng của SGML
HTML
• HTML là một ngôn ngữ định dạng/đánh dấu
quen thuộc, thông dụng được trích ra từ
SGML (HTML có thể coi là một ứng dụng của
SGML)
• HTML ban đầu được tạo ra dùng cho việc
định dạng cáca bài báo kỹ thuật để chúng có
thể được trao đổi giữa các cộng đồng khoa
học
• Ngày nay HTML cũng được sử dụng cho các
người dùng bình thường cho việc thể hiện
các tài liệu
Các hạn chế của HTML
• Dựa trên một tập cố định các thẻ (tag)
– HTML 1.0: có 10 thẻ
– HTML 4.01: có 100 thẻ
• Công nghệ trình bày không liên quan đến nội
dung
• Không hỗ trợ việc trao đổi dữ liệu
• Không có các cơ chế liên kết tinh xảo
• Không hỗ trợ việc sử dụng lại
Các ví dụ về HTML và XML
<UL>
<LI> TOM CRUISE
<UL>
<LI> CLIENT ID : 100
<LI> COMPANY : XYZ Corp.
<LI> Email : [email protected]
<LI> Phone : 3336767
<LI> Street Adress : 25th St.
<LI> City : Toronto
<LI> State : Toronto
<LI> Zip : 20056
</UL>
</UL>
<Details>
<CONTACT>
<PERSON_NAME>TOM CRUISE
</PERSON_NAME>
<ID> 100 </ID>
<COMPANY> XYZ Corp. </COMPANY>
<Email> [email protected]</Email>
<Phone> 3336767 </Phone>
<Street> 25th St. </Street>
<City> Toronto </City>
<State> Toronto </State>
<ZIP> 20056 </ZIP>
</CONTACT>
</Details>
HTML Code XML Code
XML
• XML –Ngôn ngữ đánh dấu mở rộng
– Được định nghĩa bởi tổ chức mạng toàn cầu
WWW Consortium W3C
– Phát triển cùng với công nghệ Web
• Dùng để khắc phục các hạn chế của HTML
• Đơn giản và dễ dùng hơn SGML
• XML cho phép người dùng định nghĩa một
tập riêng các thẻ và cho phép người khác có
thể hiểu được
• XML thừa kế các nét đặc trưng của SGML và
HTML