Thư viện tri thức trực tuyến
Kho tài liệu với 50,000+ tài liệu học thuật
© 2023 Siêu thị PDF - Kho tài liệu học thuật hàng đầu Việt Nam

KHAI PHÁ dữ LIỆU đề tài tìm HIỂU về RAPIDMINER và THUẬT TOÁN KMEANS áp DỤNG TRÊN dữ LIỆU THỰC tế
Nội dung xem thử
Mô tả chi tiết
TRƯỜNG ĐẠI HỌC MỎ - ĐỊA CHẤT
KHOA CÔNG NGHỆ THÔNG TIN
HỌC PHẦN : KHAI PHÁ DỮ LIỆU
ĐỀ TÀI: TÌM HIỂU VỀ RAPIDMINER VÀ THUẬT TOÁN KMEANS ÁP
DỤNG TRÊN DỮ LIỆU THỰC TẾ
BÁO CÁO BÀI TẬP LỚN
GIÁO VIÊN HƯỚNG DẪN: NGUYỄN THỊ PHƯƠNG BẮC
NHÓM SINH VIÊN THỰC HIỆN:
Nguyễn Tiến Đạt
Đỗ Thị Hương
Nguyễn Thị Thanh Thanh Nhàn
Bùi Thị Phương Thảo
Nhóm 20 i
Mục lục
Phần I: Mở đầu............................................................................................................................................1
1. Lý do chọn đề tài................................................................................................................................1
2. Mục tiêu nghiên cứu...........................................................................................................................2
3. Đối tượng và phạm vi nghiên cứu......................................................................................................2
4. Phương pháp nghiên cứu....................................................................................................................2
5. Kết cấu của đề tài................................................................................................................................3
Phần II: Nội Dung.......................................................................................................................................4
I: Tổng quan về khám phá tri thức và khai phá dữ liệu.............................................................................4
1.1. Khám phá tri thức tri thức...............................................................................................................4
1.1.1. Khái niệm.............................................................................................................................4
1.1.2. Vai trò của khám phá tri thức...............................................................................................5
1.1.3. Tiến trình khai phá tri thức...................................................................................................6
1.2. Khai phá dữ liệu...............................................................................................................................8
1.2.1. Khái niệm.............................................................................................................................8
1.2.2. Các phương pháp chính trong khai phá dữ liệu....................................................................9
1.2.3. Một số khó khăn và thách thức trong khai phá dữ liệu.......................................................10
1.2.4. Quá trình khai phá dữ liệu.................................................................................................10
1.2.5. Những ứng dụng của khai phá dữ liệu................................................................................12
Chương II: Khai phá dữ liệu với thuật toán phân cụm............................................................................13
2.1. Phân cụm dữ liệu...........................................................................................................................13
2.1.1. Khái niệm...........................................................................................................................13
2.1.2. Các yêu cầu về thuật toán phân cụm dữ liệu......................................................................13
2.1.3. Ý nghĩa thực tiễn của phân cụm.........................................................................................14
2.1.4. Thuật toán K-means trong phân cụm dữ liệu......................................................................14
III: Ứng dụng phần mềm khai phá dữ liệu Rapidminer vào quản lý khách hàng mua hàng của Công ty
TNHH Máy Tính Phong Vũ.....................................................................................................................19
3.1. Tổng quan về Công ty...................................................................................................................19
3.1.1. Giới thiệu...........................................................................................................................19
3.1.2. Cơ cấu tổ chức...................................................................................................................20
3.1.3. Định hướng phát triển........................................................................................................20
3.2. Phần mềm khai phá dữ liệu Rapid miner......................................................................................21
3.2.1. Giới thiệu chung.................................................................................................................21
3.2.2. Giới thiệu giao diện............................................................................................................21
Nhóm 20 ii
3.2.4. Phân cụm với Rapid Miner.................................................................................................21
3.3. Ứng dụng phân cụm dữ liệuvào quản lý khách hàng mua hàng..................................................24
3.3.1 Xác định nội dung cần khai phá..........................................................................................24
3.3.2 Lựa chọn dữ liệu.................................................................................................................24
3.3.3. Tiền xử lý dữ liệu bài toán..................................................................................................24
3.3.5. Khai phá dữ liệu bằng thuật toán K-mean..........................................................................32
3.4. Một số giải pháp đưa ra trong việc quản lý khách hàng mua hàng..............................................34
Phần III: Kết Luận....................................................................................................................................36
3.1. Kết Luận........................................................................................................................................36
3.1.1. Kết quả đạt được................................................................................................................36
3.1.2. Hạn chế của đề tài..............................................................................................................36
3.2. Hướng phát triển của đề tài...........................................................................................................36
Tài liệu tham khảo....................................................................................................................................37
Nhóm 20 iii
Từ viết tắt
CSDL
DL
KPDL
TNHH
Các kí hiệu
≤
≥
≠