Thư viện tri thức trực tuyến
Kho tài liệu với 50,000+ tài liệu học thuật
© 2023 Siêu thị PDF - Kho tài liệu học thuật hàng đầu Việt Nam

Thiết kế cơ sở dữ liệu theo mô hình anchor modeling cho hệ thống quản lý thảm thực vật
Nội dung xem thử
Mô tả chi tiết
ĐẠI HỌC ĐÀ NẴNG
TRƢỜNG ĐẠI HỌC SƢ PHẠM
DƢƠNG THỊ MINH ÁNH
THIẾT KẾ CƠ SỞ DỮ LIỆU
THEO MÔ HÌNH ANCHOR MODELING
CHO HỆ THỐNG QUẢN LÝ THẢM THỰC VẬT
Chuyên ngành: Hệ thống thông tin
Mã số: 61.49.01.04
TÓM TẮT
LUẬN VĂN THẠC SĨ HỆ THỐNG THÔNG TIN
Đà Nẵng – Năm 2017
Công trình được hoàn thành tại
TRƢỜNG ĐẠI HỌC SƢ PHẠM - ĐHĐN
Người hướng dẫn khoa học: TS. Nguyễn Trần Quốc Vinh
Phản biện 1: PGS.TS. Lê Văn Sơn
Phản biện 2: TS. Trần Thiên Thành
Luận văn được bảo vệ trước Hội đồng chấm Luận văn tốt nghiệp
thạc sĩ Hệ thống thông tin họp tại Trường Đại học Sư phạm -
ĐHĐN vào ngày 30 tháng 07 năm 2017.
Có thể tìm hiểu luận văn tại:
- Thư viện Trường Đại học Sư phạm Đà Nẵng, Đại học Đà Nẵng.
- Trung tâm thông tin học liệu, Đại học Đà Nẵng.
1
MỞ ĐẦU
1. Lý do chọn đề tài
Vấn đề xây dựng cơ sở dữ liệu ứng dụng cho mô hình quản
lý thảm thực vật đóng một vai trò rất quan trọng. Bởi theo quan điểm
sinh thái học, thảm thực vật là tấm gương phản ánh khách quan các
điều kiện tự nhiên, nhân tố môi trường. Đồng thời là thành phần quan
trọng của sinh quyển. Thực vật không những là một nhóm yếu tố tự
nhiên quan trọng của lớp vỏ địa lý mà còn là nguồn tài nguyên có giá
trị, cung cấp nguyên vật liệu đáp ứng nhu cầu sống của con người.
Dựa trên các công trình nghiên cứu về thảm thực vật [1-3].
Các CSDL này đã được tiến hành qua nhiều giai đoạn và diễn biến
theo thời gian, số liệu ngày càng được bổ sung theo thời gian nhưng
chưa có một công trình nghiên cứu tổng thể và thống nhất với các
công trình trước đó nên số liệu về thảm thực vật khác nhau theo các
công bố khác nhau. Các CSDL này phải được tổ chức và sắp xếp lại
sao cho hợp lý hơn.
Các thao tác dữ liệu truyền thống chỉ cho phép truy cập dữ
liệu ở thời điểm hiện tại, không thể truy cập đến các phiên bản dữ
liệu trong quá khứ [4].
Ngày nay, phương pháp mô hình hoá hệ thống Anchor [5]
cho phép mô hình hoá các hệ thống lớn cần lưu lại tính lịch sử của
dữ liệu. Phương pháp này ra đời nhằm giải quyết được các hạn chế
về việc lưu trữ các dữ liệu lịch sử của các phương pháp mô hình hoá
hệ thống khác như UML, ERM, FCO-IM... Bộ công cụ Anchor
2
Modeler tự động sinh CSDL thời gian Anchor cho các hệ quản trị
CSDL quan hệ đảm bảo tính toàn vẹn của CSDL. Ứng dụng của bộ
công cụ này rất lớn khi nó được áp dụng vào các hệ thông thông tin
lớn, nơi dữ liệu lịch sử rất quan trọng, như đa dạng hệ sinh học, ngân
hàng, bảo hiểm, hàng không, chứng khoán….
Trên quan điểm xây dựng một bộ số liệu cập nhật chính xác,
thống nhất làm cơ sở cho việc đánh giá, rà soát tính đa dạng của
thảm thực vật về mặt đa dạng loài, đa dạng giá trị sử dụng, dạng sống
và tình trạng bảo tồn của các loài thực vật nhằm phục vụ công tác
quản lý bảo tồn hệ sinh thái rừng có hiệu quả hơn.
Như vậy, thiết kế CSDL thời gian theo mô hình Anchor
(Anchor Modeling - AM) cho phép truy cập đến dữ liệu toàn cảnh ở
bất kỳ thời điểm nào trong quá khứ, cung cấp cơ chế mở rộng không
hủy, theo đó cho phép khả năng quản trị thay đổi dữ liệu rất mạnh và
mềm dẻo là cần thiết cho hệ thống quản lý thảm thực vật hiện nay là
cấp thiết.
Xuất phát từ những lý do trên được sự đồng ý và hướng dẫn
của TS. Nguyễn Trần Quốc Vinh, tôi chọn đề tài “Thiết kế cơ sở dữ
liệu theo mô hình Anchor Modeling cho hệ thống quản lý thảm
thực vật” để làm luận văn thạc sỹ.
2. Mục tiêu và nhiệm vụ đề tài
Mục tiêu
- Nghiên cứu về AM.
- Thiết kế được CSDL thời gian cho hệ thống quản lý thảm
thực vật.
3
- Xây dựng được hệ thống quản lí thảm thực vật minh hoạ.
Nhiệm vụ
- Tìm và đọc tài liệu về AM.
- Khai thác các công cụ hỗ trợ xây dựng CSDL theo AM.
- Xây dựng CSDL cho hệ thống quản lý thảm thực vật theo AM.
- Xây dựng hệ thống thông tin quản lý thảm thực vật sử dụng
CSDL theo thời gian cho phép tìm kiếm dữ liệu về thảm thực
vật theo bối cảnh thời gian.
3. Đối tƣợng và phạm vi nghiên cứu
Đối tƣợng nghiên cứu
- Mô hình AM.
- Thảm thực vật.
- Hệ thống thông tin quản lý.
- GIS.
Phạm vi nghiên cứu
- Xây dựng CSDL phục vụ quản lý thảm thực vật, thử nghiệm
cho một số loài trong sách đỏ khu vực Đà Nẵng.
- Sử dụng hệ quản trị CSDL SQL Server để quản lý CSDL
được thiết kế theo AM.
- Dữ liệu GIS được quản lý trên nền geoServer.
- Hệ thống thông tin quản lý thảm thực vật trên nền GIS cho
phép tìm kiếm và hiển thị kết quả theo bối cảnh thời gian.
4. Phƣơng pháp nghiên cứu
Sử dụng hai phương pháp chính là nghiên cứu lý thuyết và
nghiên cứu thực nghiệm.
4
Phƣơng pháp nghiên cứu tài liệu
- Tìm hiểu về CSDL và hệ quản trị CSDL, AM.
- Nghiên cứu từ các bài báo, phân tích và thiết kế CSDL, các
CSDL liên quan về thảm thực vật, các KBT thiên nhiên…
- Đề xuất các chức năng cho ứng dụng dựa trên các kỹ thuật
đã nghiên cứu.
Phƣơng pháp thực nghiệm
- Áp dụng mô hình phát triển phần mềm thác nước để xây
dựng hệ thống thông tin quản lý thảm thực vật sử dụng
CSDL theo thời gian cho phép tìm kiếm dữ liệu về thảm thực
vật theo bối cảnh thời gian trên nền GIS.
- Thực nghiệm trên dữ liệu đầu vào là thảm thực vật của các
KBT.
5. Mục đích và ý nghĩa của đề tài
Mục đích
Nghiên cứu đề xuất giải pháp thiết kế CSDL theo AM vào
quản lý dữ liệu thảm thực vật.
Ý nghĩa khoa học và thực tiễn
Về khoa học: Góp phần phát triển hệ thống thông tin địa lý
về sự đa dạng sinh học ở nước ta.
Từ kết quả nghiên cứu của đề tài tìm hiểu sâu hơn về kỹ
thuật thiết kế CSDL theo chuẩn AM.
Nghiên cứu sâu hơn về thuật toán lưu trữ và quay lại dữ liệu
tại thời điểm nào đó trong quá khứ.
5
Về thực tiễn: Kết quả nghiên cứu của đề tài thúc đẩy việc áp
dụng công nghệ thông tin vào việc hỗ trợ quản lý đa dạng sinh học,
cũng phần nào đáp ứng được các nhu cầu cần thiết về thông tin trong
công tác bảo vệ môi trường, bảo tồn đa dạng sinh học của nước nhà.
6. Bố cục luận văn
Nội dung của luận văn được trình bày bao gồm các phần
chính như sau:
Chƣơng 1 – TỔNG QUAN VỀ MÔ HÌNH ANCHOR
Chương này, luận văn trình bày các cơ sở lí thuyết về dữ liệu
có yếu tố thời gian, dữ liệu tiến hóa, mô hình hóa dữ liệu với AM,
các khái niệm cơ bản và truy cập dữ liệu trong AM.
Chƣơng 2 – ĐA DẠNG THỰC VẬT
Trong chương 2, luận văn trình bày tổng quan về đa dạng
thực vật, các phân tích, thiết kế CSDL thảm thực vật, xây dựng được
các mô hình thực thể, mô hình dữ liệu làm tiền đề giải quyết bài toán
thiết kế CSDL theo AM cho hệ thống quản lí thảm thực vật.
Chƣơng 3 – THIẾT KẾ CƠ SỞ DỮ LIỆU ANCHOR
MODELING CHO HỆ THỐNG QUẢN LÝ THẢM THỰC VẬT
Chương 3, tập trung vào thiết kế CSDL theo AM cho hệ
thống quản lí thảm thực vật, cài đặt và thực nghiệm chương trình.
Cuối cùng là những đánh giá, kết luận và hướng phát triển
của đề tài trong tương lai.
6
CHƢƠNG 1
TỔNG QUAN VỀ MÔ HÌNH ANCHOR MODELING
1.1. GIỚI THIỆU
AM kết hợp chuẩn hoá lược đồ quan hệ và tính cạnh tranh
(emulation) để cung cấp kỹ thuật mô hình hoá CSDL linh hoạt
(agile) cho dữ liệu tiến hoá. AM cung cấp hệ thống các nguyên tắc
[21] theo đó, mô hình thu được có thể được triển khai theo mô hình
dữ liệu quan hệ một cách đơn giản. Kết quả trực tiếp là CSDL thời
gian đạt chuẩn 6NF.
1.2. CƠ SỞ DỮ LIỆU THỜI GIAN
1.2.1. Khái niệm cơ sở dữ liệu có yếu tố thời gian
1.2.2. Thời gian thay đổi
1.2.3. Thời gian ghi
1.2.4. Thời gian diễn ra
1.3. CƠ SỞ DỮ LIỆU CHUẨN HÓA Ở MỨC THẤP
1.4. DỮ LIỆU TIẾN HÓA
1.5. MÔ HÌNH HÓA DỮ LIỆU VỚI ANCHOR MODELING
Nhìn chung, AM mang lại đầy đủ các lợi ích 8] của CSDL
đạt dạng chuẩn 6NF:
- Quản lý và xử lý được dữ liệu tiến hoá, đảm bảo tính toàn
vẹn của dữ liệu theo thời điểm bất kỳ.
- Tăng vòng đời của CSDL so với vòng đời trung bình 5 năm.
- Đơn giản hoá các khái niệm mô hình hoá (modeling
concepts), giảm thiểu hoá lỗi mô hình hoá.
- Cho phép phát triển theo mô-đun và tăng trưởng từng bước.
7
- Chuyển đổi sang CSDL vật lý đơn giản.
- Cho phép và hỗ trợ công cụ sinh tự động các kịch bản tạo
CSDL vật lý cũng như các khung nhìn, các hàm cần thiết.
- Đặc biệt, chỉ quét những dữ liệu cần thiết trong quá trình xử
lý truy vấn nhờ mỗi cột được lưu trữ riêng lẻ trong từng bảng.
- Không chấp nhận NULL nên khắc phục được vấn đề dữ liệu
thưa thớt trong CSDL thông thường.
1.6. NHỮNG KHÁI NIỆM CƠ BẢN VỀ MÔ HÌNH HÓA AM
(ANCHOR MODELING)
Các khái niệm nền tảng trong AM bao gồm neo (anchor),
giới hạn (knot), thuộc tính (attribute), thuộc tính hằng (static
attribute), thuộc tính biến thiên (historized attribute), thuộc tính hằng
giới hạn (knotted static attribute), thuộc tính biến thiên giới hạn
(knotted historized attribute). Các loại mối quan hệ (tie) bao gồm
quan hệ hằng (static tie), quan hệ biến thiên (historized tie), quan hệ
hằng giới hạn (knotted static tie), quan hệ biến thiên giới hạn
(knotted historized tie) [7].
Trong AM có các đối tượng sau:
Anchor: Lưu trữ các định danh của các thực thể
Knot: Lưu trữ miền giá trị của dữ liệu
Attributes: Lưu trữ các giá trị của các thuộc tính
Ties: Lưu trữ mối quan hệ giữa các thực thể
8
1.6.1. Tập thực thể (Anchor)
Trong mối tương quan với mô hình thực thể - mối quan hệ rất
phổ biến, có thể hiểu, anchor là tập thực thể. Anchor biểu diễn ID
của thực thể. Giới hạn đại diện cho một tập lực lượng nhỏ các giá trị
cố định theo thời gian, thường là những giá trị dùng chung cho nhiều
thực thể khác nhau.
1.6.2. Giới hạn (Knot)
Một giới hạn được sử dụng để biểu diễn một tập hợp các thực
thể cố định, thường là nhỏ, không thay đổi theo thời gian. Trong khi
các tập thực thể được sử dụng để biểu diễn các thực thể tùy ý, thì các
giới hạnđược sử dụng để quản lý các đặc tính chung trong nhiều thực
thể của một số tập thực thể.
1.6.3. Thuộc tính (Attribute)
Thuộc tính biểu diễn các thuộc tính của tập thực thể, cụ thể là
của anchor. Cần phân biệt bốn loại thuộc tính: thuộc tính hằng (Static
Attribute), thuộc tính biến thiên (Historized Attribute), thuộc tính
hằng giới hạn (Knotted Static Attribute), thuộc tính biến thiên giới
hạn (Knotted Historized Attribute), xem hình 1.2.
Hình 1.2. Kí hiệu tập thực thể
9
Một tập thực thể -Anchor (a) được thể hiện dưới dạng một
hình vuông đặc và một giới hạn -Knot (d) được thể hiện dưới dạng
hình vuông được vẽ đường viền bên ngoài với góc hơi tròn. Một
thuộc tính hằng -Static Attribute (b) và một thuộc tính hằng giới hạn
- Knotted Static Attribute (e) được thể hiện dưới dạng hình tròn được
vẽ đường viền bên ngoài.Một thuộc tính biến thiên -Historized
Attribute (c) và một thuộc tính biến thiên giới hạn -Knotted
Historized Attribute (f) được hiển thị được thể hiện dưới dạng hình
tròn với những đường viền bên ngoài kép.Các thuộc tính giới hạn
liên quan đến một giới hạn.
Định nghĩa 6 (Thuộc tính hằng - Static Attribute). Thuộc tính
hằng là những thuộc tính chấp nhận giá trị không thay đổi theo thời
gian, chẳng hạn ngày sinh của một công dân.
Định nghĩa 7 (Thuộc tính biến thiên – Historized
Attribute).Thuộc tính biến thiên là thuộc tính chấp nhận các giá trị có
thể thay đổi theo thời gian và cần ghi lại sự thay đổi này, chẳng hạn,
đơn vị công tác của một công dân.
Định nghĩa 8 (Thuộc tính hằng giới hạn – Knotted Static
Attribute). Thuộc tính hằng giới hạn biểu diễn mối quan hệ giữa thực
thể và giới hạn, cụ thể thuộc tính chấp nhận một giá trị cố định nào
đó từ tập số lượng nhỏ các giá trị; chẳng hạn, công dân có mã công
dân CMT1( chứng minh thư 1) có giới tính nam.
Định nghĩa 9 (Thuộc tính biến thiên giới hạn – Knotted
Historized Attribute).Thuộc tính biến thiên giới hạn biểu diễn thuộc
tính của một thực thể có thể chấp nhận các giá trị khác nhau từ tập số
10
lượng nhỏ các giá trị; chẳng hạn, công dân có thể được xếp vào các
nhóm tuổi khác nhau theo thời gian.
1.6.4. Mối quan hệ(Tie)
Một mối quan mô tả liên kết giữa hai hoặc nhiều tập thực thể
anchor với nhau và các thực thể giới hạn tùy chọn.
Tương tự như các thuộc tính, các mối quan hệ có bốn biến
thể: quan hệ hằng (Static Tie), quan hệ biến thiên (Historized Tie),
quan hệ hằng giới hạn (Knotted Static Tie), quan hệ biến thiên giới
hạn (Knotted Historized Tie). Xem hình 1.3.
Hình 1.3. Các mối quan hệ
Một quan hệ hằng – Static Tie (a) và một quan hệ hằng giới
hạn – Knotted Static Tie (c) được thể hiện dưới dạng hình thoi đặc.
Một quan hệ biến thiên – Historized Tie (b) và một quan hệ biến
thiên giới hạn – Knotted Historized (d) được thể hiện dưới dạng hình
thoi đặc với một đường viền bên ngoài. Các quan hệ giới hạn liên
quan đến ít nhất một giới hạn. Định danh của các liên kết được đánh
dấu bằng các vòng tròn màu đen.
11
Định nghĩa 12 (Quan hệ hằng–Static Tie).Có thể hiểu mối
quan hệ hằng là mối quan hệ không thay đổi theo thời gian, chẳng hạn,
mối quan hệ cha – con sinh học giữa hai anchor công dân. Nó cũng có
thể là ví dụ cho mối quan hệ hằng giới hạn, mối quan hệ sinh học giữa
hai công dân: cha-con, mẹ-con, ông-cháu, bà-cháu, cô/dì/chú/bác – cháu
và không quan hệ huyết thống.
Định nghĩa 13 (Quan hệ biến thiên – Historized Tie).Mối
quan hệ quan hệ biến thiên là mối liên kết có thể chấp nhận các giá
trị khác nhau theo thời gian từ tập số lượng lớn các giá trị.
Định nghĩa 15 (Quan hệ biến thiên giới hạn – Knotted
Historized). Mối quan hệ biến thiên giới hạn đại diện cho mối liên
kết chấp nhận các giá trị khác nhau theo thời gian từ một tập số
lượng nhỏ các giá trị giữa hai hoặc nhiều thực thể với nhau. Chẳng
hạn, mối quan hệ bạn bè, người yêu, vợ chồng giữa hai công dân với
nhau.
1.6.5. Quy ƣớc đặt tên
Quy ước đặt tên được gợi ý chỉ sử dụng các chữ, số thông
thường và các ký tự gạch dưới. Điều này đảm bảo rằng các tên gọi
giống nhau có thể được sử dụng trong nhiều biểu diễn, chẳng hạn
như trong một CSDL quan hệ, XML hoặc một ngôn ngữ lập trình.
1.7. TRUY CẬP DỮ LIỆU
Sau khi thiết kế mô hình Anchor trên công cụ Anchor
Modeler, người dùng có thể sinh ra các đối tượng dữ liệu liên quan
[18], cụ thể trong trường hợp thử nghiệm là trong SQL Server.
12
Khung nhìn cuối cho phép truy cập đến dữ liệu ở thời điểm
hiện tại theo thời gian thực, thời điểm lớn nhất. Hàm theo thời điểm cho
phép truy cập đến dữ liệu ở thời điểm trong quá khứ được nhập vào là đối
số của hàm, dữ liệu bao gồm các giá trị mới nhất ở thời điểm đó và
thường nhỏ hơn giá trị thời điểm hiện tại theo thời gian thực.
1 create view
lAC_part_PR_in_RAT_got as
13 [RAT].RAT_ID =
[AC_PR_RAT].RAT_ID_got
2 select 14 where
3 [AC_PR_RAT].AC_ID_part, 15 [AC_PR_RAT].AC_part_PR_in_RA
T_got_ValidFrom = (
4 [AC_PR_RAT].PR_ID_in, 16 select
5 [AC_PR_RAT].RAT_ID_got, 17 max(sub.AC_part_PR_in_RAT_got_
ValidFrom)
6 [RAT].RAT_Rating, 18 from
7 [AC_PR_RAT].AC_part_PR_in_R
AT_got_ValidFrom
19 AC_part_PR_in_RAT_got [sub]
8 from 20 where
9 AC_part_PR_in_RAT_got
[AC_PR_RAT]
21 [sub].AC_ID_part =
[AC_PR_RAT].AC_ID_part
10 left join 22 and
11 RAT_Rating [RAT] 23 [sub].PR_ID_in =
[AC_PR_RAT].PR_ID_in
12 on 24 );
Hình 1.5. Khung nhìn cuối