Siêu thị PDFTải ngay đi em, trời tối mất

Thư viện tri thức trực tuyến

Kho tài liệu với 50,000+ tài liệu học thuật

© 2023 Siêu thị PDF - Kho tài liệu học thuật hàng đầu Việt Nam

Ứng dụng web ngữ nghĩa trong xây dựng hệ thống thông tin quản lý công tác nghiên cứu khoa học của viện nghiên cứu phát triển kinh tế - xã hội đà nẵng
PREMIUM
Số trang
144
Kích thước
11.6 MB
Định dạng
PDF
Lượt xem
978

Ứng dụng web ngữ nghĩa trong xây dựng hệ thống thông tin quản lý công tác nghiên cứu khoa học của viện nghiên cứu phát triển kinh tế - xã hội đà nẵng

Nội dung xem thử

Mô tả chi tiết

ĐẠI HỌC ĐÀ NẴNG

TRƯỜNG ĐẠI HỌC SƯ PHẠM

PHẠM HỮU THẮNG

ỨNG DỤNG WEB NGỮ NGHĨA TRONG

XÂY DỰNG HỆ THỐNG THÔNG TIN QUẢN LÝ CÔNG TÁC

NGHIÊN CỨU KHOA HỌC CỦA VIỆN NGHIÊN CỨU

PHÁT TRIỂN KINH TẾ - XÃ HỘI ĐÀ NẴNG

Chuyên ngành: HỆ THỐNG THÔNG TIN

Mã số: 61.49.01.04

TÓM TẮT

LUẬN VĂN THẠC SĨ HỆ THỐNG THÔNG TIN

Đà Nẵng – Năm 2017

Công trình được hoàn thành tại

TRƯỜNG ĐẠI HỌC SƯ PHẠM - ĐHĐN

Người hướng dẫn khoa học: PGS. TS. NGUYỄN THANH BÌNH

Phản biện 1: TS. Phạm Anh Phương

Phản biện 2: TS. Trần Thiên Thành

Luận văn được bảo vệ trước Hội đồng chấm Luận văn tốt nghiệp thạc sĩ

Hệ thống thông tin họp tại Trường Đại học Sư phạm – ĐHĐN vào ngày

30 tháng 7 năm 2017.

Có thể tìm hiểu luận văn tại:

- Thư viện Trường Đại học Sư phạm Đà Nẵng, Đại học Đà Nẵng.

- Trung tâm thông tin học liệu, Đại học Đà Nẵng.

1

MỞ ĐẦU

1. Lý do chọn đề tài

Ngày nay phần mềm được coi là vũ khí chiến lược cho phép

các tổ chức Thương mại, Chính phủ các nước đạt được những sản

phẩm và dịch vụ tốt nhất nhưng với thời gian và chi phí sản xuất tối

thiểu. Để phản ứng nhanh với hoạt động của thị trường đòi hỏi phải

có những quá trình tổ chức tốt trong nền kinh tế toàn cầu hoạt động

liên tục 24 giờ trong ngày, 7 ngày trong tuần, rất nhiều quá trình như

vậy sẽ không vận hành tốt nếu thiếu một Phần mềm hay một Hệ

thống thông tin phù hợp, với sự phát triển mạnh mẽ của Internet,

thuật ngữ Hệ thống thông tin dần quen thuộc đối với chúng ta. Với

tốc độ phát triển mạnh mẽ như hiện nay, Internet đã chứng tỏ nó đang

dần trở thành một yếu tố không thể thiếu trong cuộc sống hiện đại.

Với việc đóng một vai trò cực kỳ quan trọng trong hầu hết các lĩnh

vực của đời sống, việc tin học hóa các quy trình làm việc để xây

dựng các Hệ thống thông tin ứng dụng trong công tác quản lý và điều

hành là một nhu cầu tất yếu của xã hội. Trong những năm gần đây

Nhà nước Việt Nam thật sự chú trọng phát triển ứng dụng công nghệ

thông tin vào công tác quản lý và điều hành của các cơ quan hành

chính, đơn vị sự nghiệp của Nhà nước, cụ thể Nhà nước đã ban hành

nhiều văn bản khuyến kích việc tin học hóa. Bên cạnh đó, trong lĩnh

vực nghiên cứu khoa học việc ứng dụng công nghệ thông tin vào

công tác quản lý, nghiên cứu khoa học góp phần quan trọng trong

việc nâng cao chất lượng nghiên cứu khoa học, tạo điều kiện tốt nhất

cho cán bộ, nghiên cứu viên không ngừng nâng cao hiệu suất và năng

lực nghiên cứu khoa học. Viện Nghiên cứu Phát triển Kinh tế - Xã

hội Đà Nẵng là một đơn vị sự nghiệp hoạt động trong lĩnh vực nghiên

2

cứu khoa học trực thuộc UBND thành phố Đà Nẵng cũng không

ngoài xu thế phát triển chung này. Hơn nữa, ngày nay việc ứng dụng

giải pháp công nghệ Semantic web (web ngữ nghĩa) mang lại nhiều

lợi ích như, cả người và máy đều có thể hiểu thông tin trên các trang

web, nhờ đó thông tin được tìm kiếm nhanh chóng và chính xác hơn,

còn có khả năng gợi ý cho con người các khái niệm, các mối liên hệ.

Nhờ kiến trúc chặt chẽ gồm nhiều lớp, web ngữ nghĩa rất phù hợp để

xây dựng các công cụ tra cứu, tìm kiếm, thống kê các nguồn dữ liệu

như nguồn dữ liệu về các công trình nghiên cứu khoa học và thông

tin lý lịch khoa học của các nhà nghiên cứu khoa học. Cùng với sự

phát triển của có web ngữ nghĩa, ontology được sử dụng rộng rãi, đặc

biệt nó là một thành phần không tách rời của kiến trúc semantic web,

để xây dựng ngữ nghĩa cho web thì phải dựa trên nền tảng ontology.

Từ lý do trên và xuất phát từ nhu cầu tin học hóa tại đơn vị công tác

của mình, được sự hướng dẫn của PGS.TS. Nguyễn Thanh Bình đã

định hướng cho tôi chọn hướng nghiên cứu và thực hiện Đề tài “Ứng

dụng web ngữ nghĩa trong xây dựng Hệ thống thông tin Quản lý công

tác nghiên cứu khoa học của Viện Nghiên cứu Phát triển Kinh tế - Xã

hội Đà Nẵng” làm luận văn tốt nghiệp của mình.

2. Mục tiêu và nhiệm vụ của Đề tài

2.1. Mục tiêu

Ứng dụng web ngữ nghĩa trong việc xây dựng Hệ thống thông

tin quản lý các công trình nghiên cứu khoa học của Viện gồm: Các đề

tài, dự án, đề án, báo cáo nghiên cứu, bài báo khoa học và các tài

liệu, tư liệu phục vụ công tác nghiên cứu và để nâng cao hơn hiệu

quả tra cứu tài liệu, lý lịch khoa học của cán bộ quản lý, nghiên cứu

viên của Viện, đồng thời hỗ trợ tốt công tác quản lý và điều hành

chung trong hoạt động nghiên cứu khoa học tại Viện Nghiên cứu

3

Phát triển Kinh tế - Xã hội Đà Nẵng.

2.2. Nhiệm vụ

- Nghiên cứu tổng quan về web ngữ nghĩa và xây dựng bộ từ

vựng ontology về công trình nghiên cứu, lý lịch khoa học của cán bộ,

nghiên cứu viên của Viện.

- Các công cụ, thư viện hỗ trợ xây dựng web ngữ nghĩa. Tìm

hiểu và chọn những công cụ để phát triển hệ thống một cách hiệu

quả.

- Phân tích và xây dựng hệ thống thông tin quản lý công tác

nghiên cứu khoa học của Viện Nghiên cứu Phát triển Kinh tế - Xã

hội Đà Nẵng.

- Thực nghiệm chương trình tại phòng Quản lý khoa học thuộc

Viện Nghiên cứu Phát triển Kinh tế - Xã hội Đà Nẵng.

3. Đối tượng và phạm vi nghiên cứu

3.1. Đối tượng

- Các vấn đề liên quan đến web ngữ nghĩa

- Công cụ xây dựng web ngữ nghĩa

- Phương pháp xây dựng Hệ thống web ngữ nghĩa

- Các vấn đề liên quan đến thông tin quản lý các công trình

nghiên cứu khoa học của Viện.

3.2. Phạm vi nghiên cứu

Trong khuôn khổ của luận văn thuộc loại nghiên cứu và ứng

dụng, tôi chỉ giới hạn nghiên cứu các vấn đề sau:

- Công nghệ web ngữ nghĩa.

- Phương pháp xây dựng ontology.

- Cổng thông tin điện tử Portal.

- Framework mã nguồn mở.

4

4. Phương pháp nghiên cứu

4.1. Về lý thuyết

- Tiến hành thu thập và nghiên cứu các tài liệu có liên quan

đến triển khai các công trình nghiên cứu khoa học của Viện.

- Tìm hiểu về web ngữ nghĩa để xây dựng website.

- Nghiên cứu về ontology.

- Khảo sát, thu thập dữ liệu liên quan tới các công trình nghiên

cứu khoa học

của các cán bộ, nghiên cứu viên của Viện Nghiên cứu Phát

triển Kinh tế - Xã hội Đà Nẵng đã và đang thực hiện.

- Quy trình quản lý hoạt động nghiên cứu khoa học của Viện.

4.2. Về thực nghiệm

- Xây dựng ontology, triển khai thực tế trên Cổng thông tin

điện tử Portal mã nguồn mở.

- Kiểm tra, thử nghiệm, nhận xét và đánh giá kết quả.

5. Giải pháp đề xuất

- Sử dụng phần mềm để thiết kế ontology: Gồm khái niệm,

thông tin của các

công trình nghiên cứu khoa học, người dùng sử dụng ontology

để tra cứu, tìm kiếm và trích lọc thông tin, dữ liệu.

- Sử dụng bộ công cụ:

+ Pretégé 5.2.0.

+ Portal Plone.zope CMS 4.3.

+ Ngôn ngữ Python với framework: Django.templates.

6. Ý nghĩa của Đề tài

6.1. Ý nghĩa khoa học

Tìm hiểu và vận dụng tốt các công cụ xây dựng phát triển web

ngữ nghĩa, phương pháp xây dựng ontology về công trình nghiên cứu

5

khoa học nói chung và về các đề tài, dự án, đề án, báo cáo nghiên

cứu, bài báo khoa học nói riêng. Ứng dụng web ngữ nghĩa về mặt tra

cứu, tìm kiếm và trích lọc thông tin, dữ liệu. Kết quả của Đề tài có

thể làm tài liệu tham khảo cho các Viện Nghiên cứu, các đơn vị quản

lý khoa học tại các Sở, ban, ngành, các đơn vị quản lý của các trường

Đại học, Cao đẳng trong việc phát triển Hệ thống quản lý các công

trình nghiên cứu khoa học.

6.2. Ý nghĩa thực tiễn

Góp phần tin học hoá trong công tác quản lý hành chính Nhà

nước, giúp giảm thiểu giấy tờ và thời gian điều hành tác nghiệp đồng

thời nâng cao chất lượng trong nghiên cứu khoa học và tăng cường

hiệu quả công tác quản lý tại Viện Nghiên cứu Phát triển Kinh tế - Xã

hội Đà Nẵng.

7. Kết quả

7.1. Lý thuyết

- Hiểu và ứng dụng được các công cụ xây dựng web ngữ nghĩa

- Hiểu rõ quy trình, công việc chuyên môn về nghiên cứu khoa

học, các công việc quản lý về nghiên cứu khoa học tại Viện.

7.2. Thực tiễn

Xây dựng Hệ thống thông tin quản lý công tác nghiên cứu

khoa học của Viện Nghiên cứu Phát triển Kinh tế - Xã hội Đà Nẵng,

cài đặt và sử dụng tại phòng Quản lý khoa học thuộc Viện.

8. Bố cục của luận văn

Luận văn được trình bày thành 3 chương như sau:

CHƯƠNG 1: NGHIÊN CỨU TỔNG QUAN

Giới thiệu lý thuyết về web ngữ nghĩa, những ứng dụng và

triển vọng của web ngữ nghĩa trong giai đoạn hiện nay. Các công

nghệ và công cụ phần mềm sử dụng trong web ngữ nghĩa.

6

CHƯƠNG 2: PHÂN TÍCH VÀ THIẾT KẾ HỆ THỐNG

Tìm hiểu thực trạng công tác quản lý nghiên cứu khoa học của

Viện Nghiên cứu Phát triển Kinh tế - Xã hội Đà Nẵng từ đó phân tích

và thiết kế Hệ thống.

CHƯƠNG 3: XÂY DỰNG HỆ THỐNG VÀ THỬ NGHIỆM

Thiết kế và xây dựng dữ liệu ontology, phát triển ứng dụng thử

nghiệm tại Viện Nghiên cứu Phát triển Kinh tế - Xã hội Đà Nẵng.

7

CHƯƠNG 1

NGHIÊN CỨU TỔNG QUAN

1.1. TỔNG QUAN VỀ WEB NGỮ NGHĨA

Web 2.0 đã đạt được những thành tựu rất đáng kể trong việc

nâng cao tính tương tác cũng như đẩy nhanh tốc độ xử lý đáp ứng

yêu cầu của người dùng. Tuy nhiên trong xã hội thông tin đương đại

nhu cầu của người dùng không dừng lại ở việc cải thiện tốc độ mà

còn phải cải thiện chất lượng xử lý của trang Web theo yêu cầu ngày

càng nâng cao. Web 3.0 (Semantic web - web ngữ nghĩa) ra đời

nhằm đáp ứng những yêu cầu về chất lượng đó.

Với đặc điểm chính là nâng cao khả năng chia sẻ tài nguyên và

tăng “sự hiểu biết” trong quá trình xử lý dữ liệu của máy tính. Web

ngữ nghĩa đã đi sâu vào phân tích và định hướng dữ liệu, đồng thời

hỗ trợ phát triển ứng dụng web ngữ nghĩa trên nhiều lĩnh vực khác

nhau. Một trong những lĩnh vực thế mạnh của web ngữ nghĩa là xử

lý và tìm kiếm thông tin. Việc phân tích và định hướng nội dung lưu

trữ cho phép chúng ta xây dựng những cơ sở dữ liệu phục vụ tìm

kiếm chính xác hơn, tinh gọn hơn

1.1.1. Giới thiệu

Web ngữ nghĩa là một ý tưởng về việc dữ liệu trên web được

xác định và liên kết với nhau theo cách mà nó có thể được sử dụng

bởi máy tính không chỉ cho mục đích thể hiện mà còn cho mục đích

tự động, tích hợp và tái sử dụng dữ liệu thông qua nhiều ứng dụng

khác nhau.

1.1.2. Khái niệm

Web Ngữ nghĩa được xây dựng dựa trên cú pháp sử dụng URI

để biểu diễn dữ liệu, luôn luôn trong bộ ba cấu trúc: tức là các bộ ba

8

của dữ liệu URI mà có thể được giữ lại trong cơ sở dữ liệu hoặc được

trao đổi trong World Wide Web dùng một tập những cú pháp đặc biệt

được phát triển riêng cho tác vụ nào đó. Cú pháp này được gọi là cú

pháp RDF (Resource Description Framework).

Phân biệt web ngữ nghĩa với web 2.0:

❖ Web 2.0: lưu trữ thông tin (store things)

❖ Web ngữ nghĩa: thao tác trên thông tin

Hình 1.1. Liên kết ngữ nghĩa giữa các nguồn khác nhau trong

semantic web

1.1.3. Nội dung xây dựng hệ thống web ngữ nghĩa

Chuẩn hoá các ngôn ngữ biểu diễn dữ liệu (XML) và các

siêu dữ liệu (RDF) trên web

Chuẩn hoá các ngôn ngữ biểu diễn ontology cho web có Ngữ

nghĩa

Tìm kiếm ngữ nghĩa (Semantic Search Engine)

Tìm kiếm ngữ nghĩa (Semantic search): Là tìm kiếm thông

tin không dựa trên sự hiện diện của từ khóa hay cụm từ, mà dựa vào

nghĩa của từ.

9

Tìm kiếm ngữ nghĩa hữu dụng trong việc:

- Xử lý các thông tin phức tạp từ nhiều nguồn khác nhau.

- Truy hồi tài liệu dựa trên một tập các mối quan hệ bên

ngoài các tài liệu đó.

- Cung cấp nhiều lựa chọn cho việc nghiên cứu sâu hơn.

- Xác định và sàng lọc kết quả hiệu quả hơn.

- Sử dụng thông tin từ nguồn có thẩm quyền hiệu quả hơn để

định hướng tìm kiếm.

Phát triển nâng cao Web ngữ nghĩa (Semantic Web

Advanced Development - SWAD)

Một số thành tựu của Semantic web trên thế giới và ở Việt

Nam

Công cụ tìm kiếm Swoogle

Công cụ tìm kiếm Kngine

VN-KIM (Viet Nam Knowledge and Information

Management)

1.1.4. Kiến trúc phân tầng của web ngữ nghĩa

Hinh 1.2. Kiến trúc của web ngữ nghĩa

a. Unicode và định danh tài nguyên thống nhất

b. Biểu diễn XML

10

c. Trao đổi dữ liệu RDF

d. Lược đồ RDF

e. Bản thể luận

f. Tầng Logic

g. Tầng chứng minh

h. Tầng xác nhận

i. Giao diện người dùng và ứng dụng

1.2. RDF – NỀN TẢNG CỦA WEB NGỮ NGHĨA

1.2.1. Khái niệm

1.2.2. Mô hình RDF

1.2.3. Đồ thị RDF

Hình 1.3. Đồ thị RDF

1.2.4. Namespace

1.2.5. Literal

1.2.6. Kiểu dữ liệu có cấu trúc

1.2.7. RDFS (RDF Schema)

1.3. ONTOLOGY VÀ NGÔN NGỮ OWL

1.3.1. Định nghĩa Ontology

1.3.2. Các lĩnh vực ứng dụng ontology

1.3.3. Vai trò ontology và web ngữ nghĩa

1.3.4. Các thành phần của ontology

Ontology được sử dụng như là một biểu mẫu trình bày tri thức

về thế giới hay một phần của nó. Ontology thường miêu tả:

a) Cá thể (Individuals) – Thể hiện

b) Lớp (Classes) - Khái niệm

11

c) Thuộc tính (Properties)

d) Mối quan hệ (Relation)

1.3.5. Ngôn ngữ OWL

1.3.6. Hệ truy vấn SPARQL

1.4. MỘT SỐ PHẦN MỀM BIÊN TẬP ONTOLOGY

1.4.1. Phần mềm WebODE

1.4.2. Phần mềm Jena

1.4.3. Phần mềm Protégé

Đây là bộ phần mềm mã nguồn mở Java được nghiên cứu và

phát triển từ năm 1998 bởi nhóm nghiên cứu của Mark Musen thuộc

đại học Stanford, California.

1.5. ĐỀ XUẤT CÔNG CỤ PHẦN MỀM XÂY DỰNG HỆ

THỐNG

1.5.1. Django-RDF.library

Django-RDF.library là một framework vớ

i bộ phân tích cú

pháp viết bằng ngôn ngữ Python theo dựa trên phân tích cú pháp

RDF và truy vấn các mô hình hiện tại bằng các lớp và thuộc tính

RDFS hoặc OWL bằng cách sử dụng một phiên bản ngôn ngữ truy

vấn đến SPARQL.

1.5.2. Ngôn ngữ Python với framework: Django.templates

Django.templates là một web framework được viết hoàn toàn

bằng ngôn ngữ Python, Django có sẵn chức năng tạo sẵn một

template có cấu trúc hoàn chỉnh và mẫu mực để thuận tiện thực hiện

một Project một cách nhanh chóng và có thể tích hợp một cách dễ

dàng vào hệ thống Portal Plone.zope.

1.5.3. Hệ thống cổng thông tin điện tử Portal Zope.Plone

Enterprise CMS tích hợp sẵn hệ quản trị cơ sở dữ liệu Object

Database (ZODB)

12

- Portal Plone.zope Enterprise CMS (Plone): Plone là một hệ

quản trị nội dung (CMS) nguồn mở, miễn phí được phát triển trên

ngôn ngữ Python. Plone cung cấp cho người dùng tất cả các hỗ trợ

quản lý rất mạnh để có thể quản lý tổ chức của bạn ở mọi cấp.

- ZODB hệ thống ngôn ngữ bao gồm tập các câu lệnh sử dụng

để tương tác với cơ sở dữ liệu quan hệ, có sẵn hỗ trợ ngôn ngữ truy

vấn SPARQL.

1.6. THIẾT KẾ ONTOLOGY

Gồm 7 bước theo thứ tự như sau:

Bước 1: Xác định lĩnh vực và phạm vi của ontology

Bước 3: Liệt kê các thuật ngữ quan trọng

Bước 4: Xác định các lớp và phân cấp của các lớp

Bước 5: Xác định các thuộc tính

Bước 6: Xác định ràng buộc của các thuộc tính

Bước 7: Tạo các thể hiện / thực thể (individuals).

1.7. KẾT LUẬN CHƯƠNG 1

Trong chương này, tôi trình bày cơ sở lý thuyết về web ngữ

nghĩa, ngôn ngữ RDF, ontology- ngôn ngữ OWL, hệ truy vấn

SPARQL, đồng thời giới thiệu các công cụ biên tập ontology và đề

xuất công cụ phần mềm xây dựng hệ thống thông tin quản lý công tác

nghiên cứu khoa học của Viện Nghiên cứu Phát triển Kinh tế - Xã

hội Đà Nẵng. Từ những nghiên cứu này, tôi có thêm những kiến thức

cơ bản về lý thuyết thông tin của các nghiên cứu đã thực hiện để tiến

hành thu thập dữ liệu chi tiết, phục vụ cho việc kế thừa, áp dụng thực

hiện các chương tiếp theo của luận văn.

Tải ngay đi em, còn do dự, trời tối mất!