Thư viện tri thức trực tuyến
Kho tài liệu với 50,000+ tài liệu học thuật
© 2023 Siêu thị PDF - Kho tài liệu học thuật hàng đầu Việt Nam

Nghiên cứu hệ sinh ánh xạ đóng và ứng dụng trong thể hiện ngữ nghĩa dữ liệu
Nội dung xem thử
Mô tả chi tiết
BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC
VÀ CÔNG NGHỆ VIỆT NAM
VIỆN CÔNG NGHỆ THÔNG TIN
BÙI ĐỨC MINH
NGHIÊN CỨU HỆ SINH ÁNH XẠ ĐÓNG
VÀ ỨNG DỤNG TRONG THỂ HIỆN
NGỮ NGHĨA DỮ LIỆU
LUẬN ÁN TIẾN SĨ TOÁN HỌC
HÀ NỘI – 2014
BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC
VÀ CÔNG NGHỆ VIỆT NAM
VIỆN CÔNG NGHỆ THÔNG TIN
BÙI ĐỨC MINH
NGHIÊN CỨU HỆ SINH ÁNH XẠ ĐÓNG
VÀ ỨNG DỤNG TRONG THỂ HIỆN
NGỮ NGHĨA DỮ LIỆU
Chuyên ngành: BẢO ĐẢM TOÁN HỌC CHO MÁY TÍNH
VÀ HỆ THỐNG TÍNH TOÁN
Mã số: 62.46.35.01
LUẬN ÁN TIẾN SĨ TOÁN HỌC
NGƯỜI HƯỚNG DẪN KHOA HỌC:
1. PGS.TSKH. NGUYỄN XUÂN HUY
2. TS. HOÀNG QUANG
HÀ NỘI - 2014
1
LỜI CAM ĐOAN
Tôi cam đoan đây là công trình nghiên cứu của riêng tôi. Các số liệu, kết quả
trong luận án là trung thực và chưa từng công bố trong bất kỳ công trình nào khác.
Tác giả luận án
Bùi Đức Minh
2
LỜI CÁM ƠN
Luận án được thực hiện và hoàn thành tại Viện Công nghệ Thông tin, Viện
Khoa học và Công nghệ Việt Nam, dưới sự hướng dẫn khoa học của PGS TSKH
Nguyễn Xuân Huy và TS Hoàng Quang. Nhân dịp này, xin cho tôi được gửi đến
những người thầy của mình lời cám ơn chân thành về những chỉ dẫn khoa học và
những hướng dẫn tận tình trong quá trình thực hiện luận án. Đặc biệt, xin cho tôi
được bày tỏ lòng biết ơn sâu sắc nhất đến PGS TSKH Nguyễn Xuân Huy, người
Thầy mà tôi đã may mắn được học tập và làm việc trong khoảng thời gian dài,
người đã định hướng, động viên và khơi gợi lòng ham mê nghiên cứu khoa học
cũng như truyền thụ các kiến thức, kinh nghiệm sâu sắc về chuyên môn cho tôi
trong quá trình học tập và thực hiện luận án.
Lời cám ơn chân thành nhất xin gửi đến GS TS Vũ Đức Thi, PGS TS Đoàn
Văn Ban, TS Lê Văn Phùng đã có nhiều nhận xét, góp ý quý báu và định hướng cho
tác giả trong việc nghiên cứu đề tài đang thực hiện.
Tôi xin trân trọng cám ơn đến lãnh đạo Viện CNTT, PGS TS Thái Quang
Vinh, PGS TS Lương Chi Mai, PGS TS Đặng Văn Đức và các Thầy, Cô trong Viện
đã tạo điều kiện tốt nhất cho tôi trong quá trình học tập, nghiên cứu và thực hiện
luận án tại Viện.
Cuối cùng, xin cho tôi gửi lời cám ơn chân thành đến Ban Giám hiệu, lãnh đạo
các phòng ban cùng các đồng nghiệp Khoa CNTT Trường CĐ GTVT Tp. HCM và
gia đình đã tạo điều kiện thuận lợi nhất về vật chất cũng như dành nhiều động viên
về mặt tinh thần để tôi có thể yên tâm học tập và hoàn thành luận án.
3
MỤC LỤC
LỜI CAM ĐOAN ......................................................................................................1
LỜI CÁM ƠN............................................................................................................2
MỤC LỤC..................................................................................................................3
DANH MỤC CÁC HÌNH.........................................................................................6
DANH MỤC CÁC BẢNG ........................................................................................7
DANH MỤC TỪ VIẾT TẮT....................................................................................8
PHẦN MỞ ĐẦU........................................................................................................9
CHƯƠNG 1 MỘT SỐ KHÁI NIỆM CƠ BẢN VỀ CƠ SỞ DỮ LIỆU QUAN
HỆ VÀ KHAI PHÁ DỮ LIỆU ........................................................18
1.1. Khái niệm về cơ sở dữ liệu quan hệ ...............................................................19
1.2. Phụ thuộc hàm ................................................................................................19
1.2.1. Khái niệm phụ thuộc hàm..................................................................................20
1.2.2. Lược đồ quan hệ ................................................................................................21
1.2.3. Bao đóng tập phụ thuộc hàm .............................................................................21
1.2.4. Định lý tương đương..........................................................................................22
1.2.5. Bao đóng tập thuộc tính.....................................................................................23
1.2.6. Bài toán thành viên ............................................................................................24
1.3. Khóa và phản khóa của lược đồ quan hệ........................................................24
1.3.1. Khóa của lược đồ quan hệ .................................................................................25
1.3.2. Phản khóa của lược đồ quan hệ .........................................................................26
1.4. Một số khái niệm trong khai phá dữ liệu........................................................27
1.4.1. Một số khái niệm cơ bản....................................................................................27
1.4.2. Luật kết hợp và kết nối Galois...........................................................................29
1.5. Kết luận chương 1 ..........................................................................................30
CHƯƠNG 2 ÁNH XẠ ĐÓNG&LÝ THUYẾT GIÀN GIAO VÀ ỨNG DỤNG31
2.1. Ánh xạ đóng ...................................................................................................33
2.1.1. Các khái niệm và tính chất ánh xạ đóng ............................................................33
2.1.2. Phép hạn chế trên ánh xạ đóng ..........................................................................35
2.1.3. Điểm bất động(tập đóng) trên ánh xạ đóng .......................................................35
2.2. Các phép toán trên ánh xạ đóng .....................................................................36
4
2.2.1. Phép toán hội .....................................................................................................36
2.2.2. Phép toán hợp thành...........................................................................................36
2.2.3. Ứng dụng phép toán hợp thành..........................................................................41
2.3. Cơ sở và phản cơ sở ánh xạ đóng...................................................................43
2.3.1. Cơ sở ánh xạ đóng .............................................................................................43
2.3.2. Phản cơ sở ánh xạ đóng .....................................................................................44
2.4. Giàn giao ........................................................................................................45
2.4.1. Một số khái niệm cơ bản....................................................................................45
2.4.2. Sự tương quan giữa tập phản cơ sở và tập đối nguyên tử..................................48
2.5. Ứng dụng giàn giao với bài toán ẩn tập mục nhạy cảm.................................50
2.5.1. Đặt vấn đề ..........................................................................................................50
2.5.2. Phát biểu bài toán...............................................................................................51
2.5.3. Cơ sở lý thuyết...................................................................................................53
2.5.4. Thuật toán ẩn tập mục nhạy cảm .......................................................................56
2.5.5. Kết quả thử nghiệm............................................................................................60
2.6. Giàn giao và ứng dụng trong khai thác tập phổ biến......................................61
2.6.1. Cơ sở lý thuyết...................................................................................................62
2.6.2. Thuật toán xác định họ các tập phổ biến tối đại ................................................63
2.7. Kết luận chương 2 ..........................................................................................65
CHƯƠNG 3 HỆ SINH AXĐ VÀ MỘT SỐ KẾT QUẢ NGHIÊN CỨU............66
3.1. Hệ sinh ánh xạ đóng .......................................................................................68
3.1.1. Khái niệm hệ sinh AXĐ.....................................................................................68
3.1.2. Ánh xạ cảm sinh ................................................................................................69
3.1.3. Thuật toán xác định ảnh một tập con trong hệ sinh...........................................70
3.2. Giản lược tập luật sinh....................................................................................71
3.2.1. Một số khái niệm cơ sở......................................................................................71
3.2.2. Tập giản lược tự nhiên.......................................................................................75
3.2.3. Tập giản lược không dư.....................................................................................76
3.3. Thu gọn hệ sinh ánh xạ đóng..........................................................................78
3.3.1. Các khái niệm và thuật toán thu gọn hệ sinh AXĐ ...........................................79
3.3.2. Biểu diễn ảnh tập con theo phép thu gọn hệ sinh AXĐ.....................................80
3.4. Cơ sở và phản cơ sở hệ sinh ánh xạ đóng ......................................................81
3.4.1. Cơ sở hệ sinh AXĐ............................................................................................82
3.4.2. Phản cơ sở hệ sinh AXĐ....................................................................................83
3.4.3. Một dạng biểu diễn phản cơ sở hệ sinh AXĐ....................................................84
3.4.4. Sự tương quan giữa các đối tượng trong hệ sinh AXĐ .....................................87
5
3.5. Ứng dụng hệ sinh AXĐ giải bài toán hệ suy dẫn...........................................90
3.5.1. Các khái niệm và quy tắc suy dẫn......................................................................90
3.5.2. Một số dạng bài toán suy dẫn ............................................................................90
3.6. Hệ sinh cân bằng ............................................................................................94
3.6.1. Các khái niệm và một số tính chất.....................................................................94
3.6.2. Thuật toán thu gọn hệ sinh AXĐ về dạng cân bằng ..........................................97
3.7. Ứng dụng hệ sinh AXĐ trong cơ sở dữ liệu.................................................100
3.7.1. Bài toán phân rã và kết nối các quan hệ ..........................................................100
3.7.2. Một dạng biểu diễn phản khóa của lược đồ quan hệ .......................................103
3.8. Kết luận chương 3 ........................................................................................105
PHẦN KẾT LUẬN................................................................................................106
DANH MỤC CÔNG TRÌNH ĐÃ CÔNG BỐ.....................................................109
TÀI LIỆU THAM KHẢO ....................................................................................110
6
DANH MỤC CÁC HÌNH
Hình 2.1. Đồ thị của giàn các tập mục phổ biến .......................................................53
Hình 2.2. Giàn giao đầy đủ của Poset(ABE).............................................................54
Hình 2.3. Giàn các tập phổ biến sau khi xóa tập mục nhạy cảm ..............................59
Hình 2.4. Giàn các tập phổ biến................................................................................64
7
DANH MỤC CÁC BẢNG
Bảng 1.1. Bảng T với 22 giao tác..............................................................................29
Bảng 1.2. Các tập mục phổ biến theo ngưỡng = 4 ................................................29
Bảng 2.1. Bảng các tập mục với độ phổ biến và số lần sửa......................................49
Bảng 2.2. Một số kết quả thử nghiệm...................................................................... 53
Bảng 2.3. Cơ sở dữ liệu giao tác minh họa .............................................................. 61
Bảng 2.4. Các tập con và ảnh tương ứng ..................................................................64
Bảng 3.1. Danh sách các môn học ............................................................................91
Bảng 3.2. Quan hệ học trước giữa các môn ..............................................................92
Bảng 3.3. Tương ứng giữa CSDL và AXĐ.............................................................100
8
DANH MỤC TỪ VIẾT TẮT
AXĐ: Ánh xạ đóng
CSDL: Cơ sở dữ liệu
HSCB: Hệ sinh cân bằng
LĐQH: Lược đồ quan hệ
PTBD: Phụ thuộc Boole dương
PTBDTQ: Phụ thuộc Boole dương tổng quát
PTBDĐT: Phụ thuộc Boole dương đa trị
PTBDTNB: Phụ thuộc Boole dương theo nhóm bộ
PTH: Phụ thuộc hàm
9
PHẦN MỞ ĐẦU
1. Đặt vấn đề
Trong nghiên cứu và mô tả thế giới thực, cùng với việc phản ánh ngữ nghĩa dữ
liệu của cơ sở dữ liệu (CSDL) thì lý thuyết về phụ thuộc dữ liệu đóng một vai trò rất
cơ bản. Phụ thuộc dữ liệu trong thiết kế và quản trị một cơ sở dữ liệu được hiểu là
sự mô tả các ràng buộc mà dữ liệu phải thỏa mãn trong bài toán thực tế. Đây cũng là
yếu tố quyết định đến chất lượng dữ liệu trong quá trình xử lý và quản trị một hệ
thống. Phụ thuộc dữ liệu được Codd [16], người đặt những nền móng ban đầu cho
mô hình dữ liệu quan hệ từ những năm 70 với phụ thuộc logic đầu tiên là phụ thuộc
hàm (PTH). Đây là loại phụ thuộc thiết lập mối quan hệ về mặt ngữ nghĩa giữa các
tập thuộc tính trong cơ sở dữ liệu. Định lý tương đương khẳng định sự tương đương
giữa các loại suy dẫn bao gồm suy dẫn logic, suy dẫn theo quan hệ và suy dẫn theo
quan hệ có không quá p bộ là định lý rất cơ bản trong lý thuyết về phụ thuộc logic
này. Sau đó, trong các công trình được công bố tiếp theo [10], [11], [12], các tác giả
khác đã tiếp tục phát triển và xây dựng các hệ tiên đề với các dạng phụ thuộc bậc
cao góp phần đặt những nền tảng đầu tiên về cơ sở lý thuyết cho phụ thuộc dữ liệu.
Cụ thể, vào những năm 80, các nhóm nghiên cứu của Berman, Blok và Sagiv,
Delobel [13], [14], [46] đã mở rộng khái niệm PTH sang khái niệm phụ thuộc Boole
dương (PTBD), các ràng buộc dữ liệu được mô tả thông qua các công thức Boole
dương với phép sánh đẳng thức. Công thức Bool dương là những công thức có trị là
1 khi giá trị của các biến thành phần là 1. Định lý tương đương vẫn đúng đối với
phụ thuộc logic này. Cũng trong thời gian này, nhóm nghiên cứu Viện Hàn lâm
Khoa học Hungary, trong [22] công bố vào năm 1988 đã phát biểu về mối tương
quan giữa các đối tượng khóa (cơ sở) và phản khóa (phản cơ sở) trong một lược đồ
quan hệ (LĐQH). Đây là hai khái niệm đối ngẫu nhau theo nghĩa khóa là tập con
nhỏ nhất các thuộc tính có ảnh là U, phản khóa là tập con lớn nhất các thuộc tính có