Siêu thị PDFTải ngay đi em, trời tối mất

Thư viện tri thức trực tuyến

Kho tài liệu với 50,000+ tài liệu học thuật

© 2023 Siêu thị PDF - Kho tài liệu học thuật hàng đầu Việt Nam

Quy nạp quy tắc phân lớp sử dụng lý thuyết tập thô
PREMIUM
Số trang
76
Kích thước
1.1 MB
Định dạng
PDF
Lượt xem
1551

Quy nạp quy tắc phân lớp sử dụng lý thuyết tập thô

Nội dung xem thử

Mô tả chi tiết

i

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/

®¹i häc th¸i nguyªn

Tr-êng ®¹i häc C¤NG NGHÖ TH¤NG TIN Vµ TRUYÒN TH¤NG

LÊ QUANG ĐẠT

QUY NẠP QUY TẮC PHÂN LỚP

SỬ DỤNG LÝ THUYẾT TẬP THÔ

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

th¸i nguyªn - n¨m 2014

ii

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/

®¹i häc th¸i nguyªn

Tr-êng ®¹i häc C¤NG NGHÖ TH¤NG TIN Vµ TRUYÒN TH¤NG

LÊ QUANG ĐẠT

QUY NẠP QUY TẮC PHÂN LỚP

SỬ DỤNG LÝ THUYẾT TẬP THÔ

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

Chuyên ngành: KHOA HỌC MÁY TÍNH

Mã số: 60.48.01

Người hướng dẫn khoa học: PGS.TS. NGUYỄN THANH TÙNG

Thái Nguyên, 2014

iii

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/

LỜI CẢM ƠN

Để hoàn thành được luận văn này tôi đã nhận được rất nhiều sự động

viên, giúp đỡ của nhiều cá nhân và tập thể.

Trước hết, tôi xin bày tỏ lòng biết ơn sâu sắc đến PGS. TS. Nguyễn

Thanh Tùng đã hướng dẫn tôi thực hiện nghiên cứu của mình.

Xin cùng bày tỏ lòng biết ơn chân thành tới các thầy cô giáo, người đã

đem lại cho tôi những kiến thức bổ trợ, vô cùng có ích trong những năm học

vừa qua.

Cũng xin gửi lời cám ơn chân thành tới Ban Giám hiệu, Phòng Đào tạo

sau đại học, Trường Đại học Công nghệ Thông tin và Truyền thông – Đại học

Thái Nguyên đã tạo điều kiện cho tôi trong quá trình học tập.

Cuối cùng tôi xin gửi lời cám ơn đến gia đình, bạn bè, những người đã

luôn bên tôi, động viên và khuyến khích tôi trong quá trình thực hiện đề luận

văn của mình.

Thái Nguyên, ngày 18 tháng 07 năm 2014

Tác giả

Lê Quang Đạt

ii

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/

LỜI CAM ĐOAN

Tôi xin cam đoan đây là công trình nghiên cứu của tôi dưới sự hướng

dẫn của PGS.TS. Nguyễn Thanh Tùng. Các số liệu, kết quả nghiên cứu trong

luận văn là trung thực và chưa được ai công bố.

Tác giả

Lê Quang Đạt

iii

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/

MỤC LỤC

LỜI CẢM ƠN............................................................................................i

LỜI CAM ĐOAN .....................................................................................ii

MỤC LỤC...............................................................................................iii

DANH MỤC BẢNG................................................................................. v

DANH MỤC HÌNH .................................................................................vi

MỞ ĐẦU.................................................................................................. 1

Chương 1: KHÁI QUÁT VỀ KHAI PHÁ DỮ LIỆU VÀ BÀI TOÁN PHÂN

LỚP .......................................................................................................... 4

1.1. Khái quát về khai phá dữ liệu................................................................. 4

1.1.1. Khai phá dữ liệu là gì ....................................................................... 4

1.1.2. Quy trình khai phá dữ liệu................................................................ 5

1.1.3. Các kỹ thuật khai phá dữ liệu........................................................... 6

1.1.4. Các ứng dụng của khai phá dữ liệu.................................................. 8

1.1.5. Một số thách thức đặt ra cho việc khai phá dữ liệu ...................... 11

1.2. Bài toán phân lớp.................................................................................. 12

1.2.1. Phát biểu bài toán .......................................................................... 12

1.2.2. Phương pháp tiếp cận chung để giải quyết bài toán phân lớp ....... 15

1.3. Kết luận chương 1................................................................................. 18

Chương 2: CƠ SỞ LÝ THUYẾT TẬP THÔ ........................................... 19

2.1. Giới thiệu .............................................................................................. 19

2.2. Hệ thông tin .......................................................................................... 20

2.3. Quan hệ bất khả phân biệt .................................................................... 21

2.3.1. Sự dư thừa thông tin....................................................................... 21

2.3.2. Quan hệ tương đương - Lớp tương đương..................................... 22

2.3.3. Thuật toán xác định lớp tương đương............................................ 23

2.3.4. Xấp xỉ tập hợp ................................................................................ 24

iv

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/

2.3.5. Sự không chắc chắn và hàm thuộc................................................. 34

2.3.6. Sự phụ thuộc giữa các tập thuộc tính ............................................. 35

2.4. Rút gọn thuộc tính ................................................................................ 36

2.4.1. Khái niệm ....................................................................................... 36

2.4.2. Ma trận phân biệt và hàm phân biệt............................................... 39

2.5. Kết luận chương 2................................................................................. 42

Chương 3: SỬ DỤNG LÝ THUYẾT TẬP THÔ VÀO VIỆC QUY NẠP

QUY TẮC QUYẾT ĐỊNH TỪ TẬP CÁC VÍ DỤ HỌC.......................... 43

3.1 Mở đầu ................................................................................................... 43

3.2. Một số khái niệm về quy nạp quy tắc quyết định................................. 45

3.2.1. Quy tắc quyết định ......................................................................... 45

3.2.2. Các loại thuật toán quy nạp quy tắc ............................................... 49

3.3. Các thuật toán quy nạp quy tắc quyết định........................................... 50

3.3.1 Thuật toán sinh bộ quy tắc tối tiểu.................................................. 51

3.3.2 Thuật toán sinh bộ quy tắc vét cạn.................................................. 57

3.3.3 Các thuật toán sinh bộ quy tắc thỏa mãn yêu cầu ........................... 58

3.4. Về tính toán thực nghiệm ..................................................................... 61

3.5. Kết luận chương 3................................................................................. 63

KẾT LUẬN ............................................................................................ 65

TÀI LIỆU THAM KHẢO....................................................................... 67

v

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/

DANH MỤC BẢNG

Bảng 1.1 Tập đối tượng Động vật có xương sống......................................... 13

Bảng 1.2. Ma trận liên hợp (trường hợp 2 lớp) ............................................. 17

Bảng 2.1. Một hệ thông tin đơn giản ........................................................... 20

Bảng 2.2. Một hệ quyết định với C = {Age, LEMS} và D = {Walk} ............. 21

Bảng 2.3. Một bảng dữ liệu thừa thông tin .................................................. 22

Bảng 2.4. Một hệ quyết định điều tra vấn đề da cháy nắng............................ 25

Bảng 2.5. Hệ thông tin về thuộc tính của xe hơi ........................................... 28

Bảng 2.6. Bảng quyết định dùng minh họa hàm thuộc thô ............................ 35

Bảng 2.7. Hệ thông tin dùng minh họa ma trận phân biệt .............................. 39

Bảng 3.1. Một ví dụ về tập dữ liệu .............................................................. 53

a ba thuật toán (thể hiện bằng %) . 62

Bảng 3.3. So sánh đặc điểm của quy tắc quyết định ...................................... 63

Tải ngay đi em, còn do dự, trời tối mất!