Thư viện tri thức trực tuyến
Kho tài liệu với 50,000+ tài liệu học thuật
© 2023 Siêu thị PDF - Kho tài liệu học thuật hàng đầu Việt Nam

Cải tiến hiệu suất của thuật toán khai thác mẫu tuần tự với ràng buộc trọng số/ khai thác Top-K mẫu tuần tự: Báo cáo tổng kết đề tài khoa học cấp Trường
Nội dung xem thử
Mô tả chi tiết
BỘ CÔNG THƯƠNG
ĐẠI HỌC CÔNG NGHIỆP THÀNH PHỐ HỒ CHÍ MINH
BÁO CÁO TỔNG KẾT ĐỀ TÀI KHOA HỌC
KẾT QUẢ THỰC HIỆN ĐỀ TÀI
NGHIÊN CỨU KHOA HỌC CẤP TRƯỜNG
Tên đề tài: Cải tiến hiệu suất của thuật toán khai thác mẫu tuần tự với ràng
buộc trọng số/ khai thác Top-K mẫu tuần tự
Mã số đề tài: 20/1.6CNTT01
Chủ nhiệm đề tài: Phạm Thị Thiết
Đơn vị thực hiện: Khoa Công nghệ Thông tin
Tp. Hồ Chí Minh, 2021
1
LỜI CÁM ƠN
Lời đầu tiên, tôi xin chân thành cảm ơn trường Đại học Công nghiệp Tp.HCM và tiểu
ban Điện – Điện Tử - CNTT đã đồng ý thông qua đề tài của nhóm chúng tôi và tạo cơ
hội cho chúng tôi có điều kiện để nghiên cứu.
Tôi xin gửi lời cảm ơn đến Phòng QLKH&HTQT, phòng Tài chính – Kế toán trường
Đại học Công nghiệp Tp.HCM đã tận tình hỗ trợ, hướng dẫn các thủ tục, hồ sơ giúp chủ
nhiệm đề tài thực hiện các văn bản liên quan.
Cuối cùng tôi xin gửi lời cảm ơn đến BCN Khoa, tập thể GV Khoa Công nghệ thông
tin, các Thầy Cô đã đồng hành động viên, tạo điều kiện để chúng tôi hoàn thành đề tài.
Chủ nhiệm đề tài
Phạm Thị Thiết
2
PHẦN I. THÔNG TIN CHUNG
I. Thông tin tổng quát
1.1. Tên đề tài: Cải tiến hiệu suất của thuật toán khai thác mẫu tuần tự với ràng
buộc trọng số/ khai thác Top-K mẫu tuần tự
1.2. Mã số: 20/1.6CNTT01
1.3. Danh sách chủ trì, thành viên tham gia thực hiện đề tài
TT
Họ và tên
(học hàm, học vị)
Đơn vị công tác Vai trò thực hiện đề tài
1 TS. Phạm Thị Thiết Khoa CNTT – ĐHCN
TP.HCM
Chủ nhiệm
2 TS. Võ Thị Thanh Vân Khoa CNTT – ĐHCN
TP.HCM
Thư ký
1.4. Đơn vị chủ trì: Khoa Công nghệ Thông tin
1.5. Thời gian thực hiện:
1.5.1. Theo hợp đồng: từ tháng 03 năm 2020 đến tháng 03 năm 2021
1.5.2. Gia hạn (nếu có): đến tháng….. năm…..
1.5.3. Thực hiện thực tế: từ tháng 03 năm 2020 đến tháng 03 năm 2021
1.6. Những thay đổi so với thuyết minh ban đầu (nếu có):
(Về mục tiêu, nội dung, phương pháp, kết quả nghiên cứu và tổ chức thực hiện; Nguyên
nhân; Ý kiến của Cơ quan quản lý)
1.7. Tổng kinh phí được phê duyệt của đề tài: 40 triệu đồng.
II. Kết quả nghiên cứu
1. Đặt vấn đề
Khai thác mẫu tuần tự từ cơ sở dữ liệu (CSDL) chuỗi là một nhiệm vụ quan trọng trong
lĩnh khai thác dữ liệu. Một CSDL chuỗi bao gồm tập chuỗi chứa các phần tử
(elements), hoặc các sự kiện (events) được sắp xếp theo thứ tự, trong đó, một mẫu tuần
tự (sequential pattern) là một chuỗi con chứa các itemset xuất hiện phổ biến có trình tự,
tất cả các item trong cùng một itemset được giả sử là chúng có cùng tại thời điểm giao
dịch hoặc chúng có trong cùng một khoảng thời gian giao dịch, thông thường tất cả các
giao dịch của một khách hàng được gắn kết với nhau theo trình tự thời gian và được
xem là một chuỗi. Do đó, bài toán khai thác mẫu tuần tự trên CSDL chuỗi là khai thác
các chuỗi con phổ biến để tìm kiếm mối liên quan giữa các item khác nhau trong
CSDL, với yêu cầu là các mẫu phổ biến là những chuỗi con trong CSDL chuỗi mà sự
xuất hiện của chúng lớn hơn ngưỡng hỗ trợ nhỏ nhất do người dùng chỉ định hay nói
cách khác, bài toán khai thác mẫu tuần tự từ CSDL chuỗi là để tìm ra tập các chuỗi con