Thư viện tri thức trực tuyến
Kho tài liệu với 50,000+ tài liệu học thuật
© 2023 Siêu thị PDF - Kho tài liệu học thuật hàng đầu Việt Nam

Ứng dụng web ngữ nghĩa trong xây dựng hệ thống thông tin quản lý công tác nghiên cứu khoa học của viện nghiên cứu phát triển kinh tế - xã hội đà nẵng
Nội dung xem thử
Mô tả chi tiết
ĐẠI HỌC ĐÀ NẴNG
TRƯỜNG ĐẠI HỌC SƯ PHẠM
PHẠM HỮU THẮNG
ỨNG DỤNG WEB NGỮ NGHĨA TRONG
XÂY DỰNG HỆ THỐNG THÔNG TIN QUẢN LÝ CÔNG TÁC
NGHIÊN CỨU KHOA HỌC CỦA VIỆN NGHIÊN CỨU
PHÁT TRIỂN KINH TẾ - XÃ HỘI ĐÀ NẴNG
Chuyên ngành: HỆ THỐNG THÔNG TIN
Mã số: 61.49.01.04
TÓM TẮT
LUẬN VĂN THẠC SĨ HỆ THỐNG THÔNG TIN
Đà Nẵng – Năm 2017
Công trình được hoàn thành tại
TRƯỜNG ĐẠI HỌC SƯ PHẠM - ĐHĐN
Người hướng dẫn khoa học: PGS. TS. NGUYỄN THANH BÌNH
Phản biện 1: TS. Phạm Anh Phương
Phản biện 2: TS. Trần Thiên Thành
Luận văn được bảo vệ trước Hội đồng chấm Luận văn tốt nghiệp thạc sĩ
Hệ thống thông tin họp tại Trường Đại học Sư phạm – ĐHĐN vào ngày
30 tháng 7 năm 2017.
Có thể tìm hiểu luận văn tại:
- Thư viện Trường Đại học Sư phạm Đà Nẵng, Đại học Đà Nẵng.
- Trung tâm thông tin học liệu, Đại học Đà Nẵng.
1
MỞ ĐẦU
1. Lý do chọn đề tài
Ngày nay phần mềm được coi là vũ khí chiến lược cho phép
các tổ chức Thương mại, Chính phủ các nước đạt được những sản
phẩm và dịch vụ tốt nhất nhưng với thời gian và chi phí sản xuất tối
thiểu. Để phản ứng nhanh với hoạt động của thị trường đòi hỏi phải
có những quá trình tổ chức tốt trong nền kinh tế toàn cầu hoạt động
liên tục 24 giờ trong ngày, 7 ngày trong tuần, rất nhiều quá trình như
vậy sẽ không vận hành tốt nếu thiếu một Phần mềm hay một Hệ
thống thông tin phù hợp, với sự phát triển mạnh mẽ của Internet,
thuật ngữ Hệ thống thông tin dần quen thuộc đối với chúng ta. Với
tốc độ phát triển mạnh mẽ như hiện nay, Internet đã chứng tỏ nó đang
dần trở thành một yếu tố không thể thiếu trong cuộc sống hiện đại.
Với việc đóng một vai trò cực kỳ quan trọng trong hầu hết các lĩnh
vực của đời sống, việc tin học hóa các quy trình làm việc để xây
dựng các Hệ thống thông tin ứng dụng trong công tác quản lý và điều
hành là một nhu cầu tất yếu của xã hội. Trong những năm gần đây
Nhà nước Việt Nam thật sự chú trọng phát triển ứng dụng công nghệ
thông tin vào công tác quản lý và điều hành của các cơ quan hành
chính, đơn vị sự nghiệp của Nhà nước, cụ thể Nhà nước đã ban hành
nhiều văn bản khuyến kích việc tin học hóa. Bên cạnh đó, trong lĩnh
vực nghiên cứu khoa học việc ứng dụng công nghệ thông tin vào
công tác quản lý, nghiên cứu khoa học góp phần quan trọng trong
việc nâng cao chất lượng nghiên cứu khoa học, tạo điều kiện tốt nhất
cho cán bộ, nghiên cứu viên không ngừng nâng cao hiệu suất và năng
lực nghiên cứu khoa học. Viện Nghiên cứu Phát triển Kinh tế - Xã
hội Đà Nẵng là một đơn vị sự nghiệp hoạt động trong lĩnh vực nghiên
2
cứu khoa học trực thuộc UBND thành phố Đà Nẵng cũng không
ngoài xu thế phát triển chung này. Hơn nữa, ngày nay việc ứng dụng
giải pháp công nghệ Semantic web (web ngữ nghĩa) mang lại nhiều
lợi ích như, cả người và máy đều có thể hiểu thông tin trên các trang
web, nhờ đó thông tin được tìm kiếm nhanh chóng và chính xác hơn,
còn có khả năng gợi ý cho con người các khái niệm, các mối liên hệ.
Nhờ kiến trúc chặt chẽ gồm nhiều lớp, web ngữ nghĩa rất phù hợp để
xây dựng các công cụ tra cứu, tìm kiếm, thống kê các nguồn dữ liệu
như nguồn dữ liệu về các công trình nghiên cứu khoa học và thông
tin lý lịch khoa học của các nhà nghiên cứu khoa học. Cùng với sự
phát triển của có web ngữ nghĩa, ontology được sử dụng rộng rãi, đặc
biệt nó là một thành phần không tách rời của kiến trúc semantic web,
để xây dựng ngữ nghĩa cho web thì phải dựa trên nền tảng ontology.
Từ lý do trên và xuất phát từ nhu cầu tin học hóa tại đơn vị công tác
của mình, được sự hướng dẫn của PGS.TS. Nguyễn Thanh Bình đã
định hướng cho tôi chọn hướng nghiên cứu và thực hiện Đề tài “Ứng
dụng web ngữ nghĩa trong xây dựng Hệ thống thông tin Quản lý công
tác nghiên cứu khoa học của Viện Nghiên cứu Phát triển Kinh tế - Xã
hội Đà Nẵng” làm luận văn tốt nghiệp của mình.
2. Mục tiêu và nhiệm vụ của Đề tài
2.1. Mục tiêu
Ứng dụng web ngữ nghĩa trong việc xây dựng Hệ thống thông
tin quản lý các công trình nghiên cứu khoa học của Viện gồm: Các đề
tài, dự án, đề án, báo cáo nghiên cứu, bài báo khoa học và các tài
liệu, tư liệu phục vụ công tác nghiên cứu và để nâng cao hơn hiệu
quả tra cứu tài liệu, lý lịch khoa học của cán bộ quản lý, nghiên cứu
viên của Viện, đồng thời hỗ trợ tốt công tác quản lý và điều hành
chung trong hoạt động nghiên cứu khoa học tại Viện Nghiên cứu
3
Phát triển Kinh tế - Xã hội Đà Nẵng.
2.2. Nhiệm vụ
- Nghiên cứu tổng quan về web ngữ nghĩa và xây dựng bộ từ
vựng ontology về công trình nghiên cứu, lý lịch khoa học của cán bộ,
nghiên cứu viên của Viện.
- Các công cụ, thư viện hỗ trợ xây dựng web ngữ nghĩa. Tìm
hiểu và chọn những công cụ để phát triển hệ thống một cách hiệu
quả.
- Phân tích và xây dựng hệ thống thông tin quản lý công tác
nghiên cứu khoa học của Viện Nghiên cứu Phát triển Kinh tế - Xã
hội Đà Nẵng.
- Thực nghiệm chương trình tại phòng Quản lý khoa học thuộc
Viện Nghiên cứu Phát triển Kinh tế - Xã hội Đà Nẵng.
3. Đối tượng và phạm vi nghiên cứu
3.1. Đối tượng
- Các vấn đề liên quan đến web ngữ nghĩa
- Công cụ xây dựng web ngữ nghĩa
- Phương pháp xây dựng Hệ thống web ngữ nghĩa
- Các vấn đề liên quan đến thông tin quản lý các công trình
nghiên cứu khoa học của Viện.
3.2. Phạm vi nghiên cứu
Trong khuôn khổ của luận văn thuộc loại nghiên cứu và ứng
dụng, tôi chỉ giới hạn nghiên cứu các vấn đề sau:
- Công nghệ web ngữ nghĩa.
- Phương pháp xây dựng ontology.
- Cổng thông tin điện tử Portal.
- Framework mã nguồn mở.
4
4. Phương pháp nghiên cứu
4.1. Về lý thuyết
- Tiến hành thu thập và nghiên cứu các tài liệu có liên quan
đến triển khai các công trình nghiên cứu khoa học của Viện.
- Tìm hiểu về web ngữ nghĩa để xây dựng website.
- Nghiên cứu về ontology.
- Khảo sát, thu thập dữ liệu liên quan tới các công trình nghiên
cứu khoa học
của các cán bộ, nghiên cứu viên của Viện Nghiên cứu Phát
triển Kinh tế - Xã hội Đà Nẵng đã và đang thực hiện.
- Quy trình quản lý hoạt động nghiên cứu khoa học của Viện.
4.2. Về thực nghiệm
- Xây dựng ontology, triển khai thực tế trên Cổng thông tin
điện tử Portal mã nguồn mở.
- Kiểm tra, thử nghiệm, nhận xét và đánh giá kết quả.
5. Giải pháp đề xuất
- Sử dụng phần mềm để thiết kế ontology: Gồm khái niệm,
thông tin của các
công trình nghiên cứu khoa học, người dùng sử dụng ontology
để tra cứu, tìm kiếm và trích lọc thông tin, dữ liệu.
- Sử dụng bộ công cụ:
+ Pretégé 5.2.0.
+ Portal Plone.zope CMS 4.3.
+ Ngôn ngữ Python với framework: Django.templates.
6. Ý nghĩa của Đề tài
6.1. Ý nghĩa khoa học
Tìm hiểu và vận dụng tốt các công cụ xây dựng phát triển web
ngữ nghĩa, phương pháp xây dựng ontology về công trình nghiên cứu
5
khoa học nói chung và về các đề tài, dự án, đề án, báo cáo nghiên
cứu, bài báo khoa học nói riêng. Ứng dụng web ngữ nghĩa về mặt tra
cứu, tìm kiếm và trích lọc thông tin, dữ liệu. Kết quả của Đề tài có
thể làm tài liệu tham khảo cho các Viện Nghiên cứu, các đơn vị quản
lý khoa học tại các Sở, ban, ngành, các đơn vị quản lý của các trường
Đại học, Cao đẳng trong việc phát triển Hệ thống quản lý các công
trình nghiên cứu khoa học.
6.2. Ý nghĩa thực tiễn
Góp phần tin học hoá trong công tác quản lý hành chính Nhà
nước, giúp giảm thiểu giấy tờ và thời gian điều hành tác nghiệp đồng
thời nâng cao chất lượng trong nghiên cứu khoa học và tăng cường
hiệu quả công tác quản lý tại Viện Nghiên cứu Phát triển Kinh tế - Xã
hội Đà Nẵng.
7. Kết quả
7.1. Lý thuyết
- Hiểu và ứng dụng được các công cụ xây dựng web ngữ nghĩa
- Hiểu rõ quy trình, công việc chuyên môn về nghiên cứu khoa
học, các công việc quản lý về nghiên cứu khoa học tại Viện.
7.2. Thực tiễn
Xây dựng Hệ thống thông tin quản lý công tác nghiên cứu
khoa học của Viện Nghiên cứu Phát triển Kinh tế - Xã hội Đà Nẵng,
cài đặt và sử dụng tại phòng Quản lý khoa học thuộc Viện.
8. Bố cục của luận văn
Luận văn được trình bày thành 3 chương như sau:
CHƯƠNG 1: NGHIÊN CỨU TỔNG QUAN
Giới thiệu lý thuyết về web ngữ nghĩa, những ứng dụng và
triển vọng của web ngữ nghĩa trong giai đoạn hiện nay. Các công
nghệ và công cụ phần mềm sử dụng trong web ngữ nghĩa.
6
CHƯƠNG 2: PHÂN TÍCH VÀ THIẾT KẾ HỆ THỐNG
Tìm hiểu thực trạng công tác quản lý nghiên cứu khoa học của
Viện Nghiên cứu Phát triển Kinh tế - Xã hội Đà Nẵng từ đó phân tích
và thiết kế Hệ thống.
CHƯƠNG 3: XÂY DỰNG HỆ THỐNG VÀ THỬ NGHIỆM
Thiết kế và xây dựng dữ liệu ontology, phát triển ứng dụng thử
nghiệm tại Viện Nghiên cứu Phát triển Kinh tế - Xã hội Đà Nẵng.
7
CHƯƠNG 1
NGHIÊN CỨU TỔNG QUAN
1.1. TỔNG QUAN VỀ WEB NGỮ NGHĨA
Web 2.0 đã đạt được những thành tựu rất đáng kể trong việc
nâng cao tính tương tác cũng như đẩy nhanh tốc độ xử lý đáp ứng
yêu cầu của người dùng. Tuy nhiên trong xã hội thông tin đương đại
nhu cầu của người dùng không dừng lại ở việc cải thiện tốc độ mà
còn phải cải thiện chất lượng xử lý của trang Web theo yêu cầu ngày
càng nâng cao. Web 3.0 (Semantic web - web ngữ nghĩa) ra đời
nhằm đáp ứng những yêu cầu về chất lượng đó.
Với đặc điểm chính là nâng cao khả năng chia sẻ tài nguyên và
tăng “sự hiểu biết” trong quá trình xử lý dữ liệu của máy tính. Web
ngữ nghĩa đã đi sâu vào phân tích và định hướng dữ liệu, đồng thời
hỗ trợ phát triển ứng dụng web ngữ nghĩa trên nhiều lĩnh vực khác
nhau. Một trong những lĩnh vực thế mạnh của web ngữ nghĩa là xử
lý và tìm kiếm thông tin. Việc phân tích và định hướng nội dung lưu
trữ cho phép chúng ta xây dựng những cơ sở dữ liệu phục vụ tìm
kiếm chính xác hơn, tinh gọn hơn
1.1.1. Giới thiệu
Web ngữ nghĩa là một ý tưởng về việc dữ liệu trên web được
xác định và liên kết với nhau theo cách mà nó có thể được sử dụng
bởi máy tính không chỉ cho mục đích thể hiện mà còn cho mục đích
tự động, tích hợp và tái sử dụng dữ liệu thông qua nhiều ứng dụng
khác nhau.
1.1.2. Khái niệm
Web Ngữ nghĩa được xây dựng dựa trên cú pháp sử dụng URI
để biểu diễn dữ liệu, luôn luôn trong bộ ba cấu trúc: tức là các bộ ba
8
của dữ liệu URI mà có thể được giữ lại trong cơ sở dữ liệu hoặc được
trao đổi trong World Wide Web dùng một tập những cú pháp đặc biệt
được phát triển riêng cho tác vụ nào đó. Cú pháp này được gọi là cú
pháp RDF (Resource Description Framework).
Phân biệt web ngữ nghĩa với web 2.0:
❖ Web 2.0: lưu trữ thông tin (store things)
❖ Web ngữ nghĩa: thao tác trên thông tin
Hình 1.1. Liên kết ngữ nghĩa giữa các nguồn khác nhau trong
semantic web
1.1.3. Nội dung xây dựng hệ thống web ngữ nghĩa
Chuẩn hoá các ngôn ngữ biểu diễn dữ liệu (XML) và các
siêu dữ liệu (RDF) trên web
Chuẩn hoá các ngôn ngữ biểu diễn ontology cho web có Ngữ
nghĩa
Tìm kiếm ngữ nghĩa (Semantic Search Engine)
Tìm kiếm ngữ nghĩa (Semantic search): Là tìm kiếm thông
tin không dựa trên sự hiện diện của từ khóa hay cụm từ, mà dựa vào
nghĩa của từ.
9
Tìm kiếm ngữ nghĩa hữu dụng trong việc:
- Xử lý các thông tin phức tạp từ nhiều nguồn khác nhau.
- Truy hồi tài liệu dựa trên một tập các mối quan hệ bên
ngoài các tài liệu đó.
- Cung cấp nhiều lựa chọn cho việc nghiên cứu sâu hơn.
- Xác định và sàng lọc kết quả hiệu quả hơn.
- Sử dụng thông tin từ nguồn có thẩm quyền hiệu quả hơn để
định hướng tìm kiếm.
Phát triển nâng cao Web ngữ nghĩa (Semantic Web
Advanced Development - SWAD)
Một số thành tựu của Semantic web trên thế giới và ở Việt
Nam
Công cụ tìm kiếm Swoogle
Công cụ tìm kiếm Kngine
VN-KIM (Viet Nam Knowledge and Information
Management)
1.1.4. Kiến trúc phân tầng của web ngữ nghĩa
Hinh 1.2. Kiến trúc của web ngữ nghĩa
a. Unicode và định danh tài nguyên thống nhất
b. Biểu diễn XML
10
c. Trao đổi dữ liệu RDF
d. Lược đồ RDF
e. Bản thể luận
f. Tầng Logic
g. Tầng chứng minh
h. Tầng xác nhận
i. Giao diện người dùng và ứng dụng
1.2. RDF – NỀN TẢNG CỦA WEB NGỮ NGHĨA
1.2.1. Khái niệm
1.2.2. Mô hình RDF
1.2.3. Đồ thị RDF
Hình 1.3. Đồ thị RDF
1.2.4. Namespace
1.2.5. Literal
1.2.6. Kiểu dữ liệu có cấu trúc
1.2.7. RDFS (RDF Schema)
1.3. ONTOLOGY VÀ NGÔN NGỮ OWL
1.3.1. Định nghĩa Ontology
1.3.2. Các lĩnh vực ứng dụng ontology
1.3.3. Vai trò ontology và web ngữ nghĩa
1.3.4. Các thành phần của ontology
Ontology được sử dụng như là một biểu mẫu trình bày tri thức
về thế giới hay một phần của nó. Ontology thường miêu tả:
a) Cá thể (Individuals) – Thể hiện
b) Lớp (Classes) - Khái niệm
11
c) Thuộc tính (Properties)
d) Mối quan hệ (Relation)
1.3.5. Ngôn ngữ OWL
1.3.6. Hệ truy vấn SPARQL
1.4. MỘT SỐ PHẦN MỀM BIÊN TẬP ONTOLOGY
1.4.1. Phần mềm WebODE
1.4.2. Phần mềm Jena
1.4.3. Phần mềm Protégé
Đây là bộ phần mềm mã nguồn mở Java được nghiên cứu và
phát triển từ năm 1998 bởi nhóm nghiên cứu của Mark Musen thuộc
đại học Stanford, California.
1.5. ĐỀ XUẤT CÔNG CỤ PHẦN MỀM XÂY DỰNG HỆ
THỐNG
1.5.1. Django-RDF.library
Django-RDF.library là một framework vớ
i bộ phân tích cú
pháp viết bằng ngôn ngữ Python theo dựa trên phân tích cú pháp
RDF và truy vấn các mô hình hiện tại bằng các lớp và thuộc tính
RDFS hoặc OWL bằng cách sử dụng một phiên bản ngôn ngữ truy
vấn đến SPARQL.
1.5.2. Ngôn ngữ Python với framework: Django.templates
Django.templates là một web framework được viết hoàn toàn
bằng ngôn ngữ Python, Django có sẵn chức năng tạo sẵn một
template có cấu trúc hoàn chỉnh và mẫu mực để thuận tiện thực hiện
một Project một cách nhanh chóng và có thể tích hợp một cách dễ
dàng vào hệ thống Portal Plone.zope.
1.5.3. Hệ thống cổng thông tin điện tử Portal Zope.Plone
Enterprise CMS tích hợp sẵn hệ quản trị cơ sở dữ liệu Object
Database (ZODB)
12
- Portal Plone.zope Enterprise CMS (Plone): Plone là một hệ
quản trị nội dung (CMS) nguồn mở, miễn phí được phát triển trên
ngôn ngữ Python. Plone cung cấp cho người dùng tất cả các hỗ trợ
quản lý rất mạnh để có thể quản lý tổ chức của bạn ở mọi cấp.
- ZODB hệ thống ngôn ngữ bao gồm tập các câu lệnh sử dụng
để tương tác với cơ sở dữ liệu quan hệ, có sẵn hỗ trợ ngôn ngữ truy
vấn SPARQL.
1.6. THIẾT KẾ ONTOLOGY
Gồm 7 bước theo thứ tự như sau:
Bước 1: Xác định lĩnh vực và phạm vi của ontology
Bước 3: Liệt kê các thuật ngữ quan trọng
Bước 4: Xác định các lớp và phân cấp của các lớp
Bước 5: Xác định các thuộc tính
Bước 6: Xác định ràng buộc của các thuộc tính
Bước 7: Tạo các thể hiện / thực thể (individuals).
1.7. KẾT LUẬN CHƯƠNG 1
Trong chương này, tôi trình bày cơ sở lý thuyết về web ngữ
nghĩa, ngôn ngữ RDF, ontology- ngôn ngữ OWL, hệ truy vấn
SPARQL, đồng thời giới thiệu các công cụ biên tập ontology và đề
xuất công cụ phần mềm xây dựng hệ thống thông tin quản lý công tác
nghiên cứu khoa học của Viện Nghiên cứu Phát triển Kinh tế - Xã
hội Đà Nẵng. Từ những nghiên cứu này, tôi có thêm những kiến thức
cơ bản về lý thuyết thông tin của các nghiên cứu đã thực hiện để tiến
hành thu thập dữ liệu chi tiết, phục vụ cho việc kế thừa, áp dụng thực
hiện các chương tiếp theo của luận văn.