Siêu thị PDFTải ngay đi em, trời tối mất

Thư viện tri thức trực tuyến

Kho tài liệu với 50,000+ tài liệu học thuật

© 2023 Siêu thị PDF - Kho tài liệu học thuật hàng đầu Việt Nam

Cải tiến hiệu suất của thuật toán khai thác mẫu tuần tự với ràng buộc trọng số/ khai thác Top-K mẫu tuần tự: Báo cáo tổng kết đề tài khoa học cấp Trường
MIỄN PHÍ
Số trang
38
Kích thước
1.8 MB
Định dạng
PDF
Lượt xem
1734

Cải tiến hiệu suất của thuật toán khai thác mẫu tuần tự với ràng buộc trọng số/ khai thác Top-K mẫu tuần tự: Báo cáo tổng kết đề tài khoa học cấp Trường

Nội dung xem thử

Mô tả chi tiết

BỘ CÔNG THƯƠNG

ĐẠI HỌC CÔNG NGHIỆP THÀNH PHỐ HỒ CHÍ MINH

BÁO CÁO TỔNG KẾT ĐỀ TÀI KHOA HỌC

KẾT QUẢ THỰC HIỆN ĐỀ TÀI

NGHIÊN CỨU KHOA HỌC CẤP TRƯỜNG

Tên đề tài: Cải tiến hiệu suất của thuật toán khai thác mẫu tuần tự với ràng

buộc trọng số/ khai thác Top-K mẫu tuần tự

Mã số đề tài: 20/1.6CNTT01

Chủ nhiệm đề tài: Phạm Thị Thiết

Đơn vị thực hiện: Khoa Công nghệ Thông tin

Tp. Hồ Chí Minh, 2021

1

LỜI CÁM ƠN

Lời đầu tiên, tôi xin chân thành cảm ơn trường Đại học Công nghiệp Tp.HCM và tiểu

ban Điện – Điện Tử - CNTT đã đồng ý thông qua đề tài của nhóm chúng tôi và tạo cơ

hội cho chúng tôi có điều kiện để nghiên cứu.

Tôi xin gửi lời cảm ơn đến Phòng QLKH&HTQT, phòng Tài chính – Kế toán trường

Đại học Công nghiệp Tp.HCM đã tận tình hỗ trợ, hướng dẫn các thủ tục, hồ sơ giúp chủ

nhiệm đề tài thực hiện các văn bản liên quan.

Cuối cùng tôi xin gửi lời cảm ơn đến BCN Khoa, tập thể GV Khoa Công nghệ thông

tin, các Thầy Cô đã đồng hành động viên, tạo điều kiện để chúng tôi hoàn thành đề tài.

Chủ nhiệm đề tài

Phạm Thị Thiết

2

PHẦN I. THÔNG TIN CHUNG

I. Thông tin tổng quát

1.1. Tên đề tài: Cải tiến hiệu suất của thuật toán khai thác mẫu tuần tự với ràng

buộc trọng số/ khai thác Top-K mẫu tuần tự

1.2. Mã số: 20/1.6CNTT01

1.3. Danh sách chủ trì, thành viên tham gia thực hiện đề tài

TT

Họ và tên

(học hàm, học vị)

Đơn vị công tác Vai trò thực hiện đề tài

1 TS. Phạm Thị Thiết Khoa CNTT – ĐHCN

TP.HCM

Chủ nhiệm

2 TS. Võ Thị Thanh Vân Khoa CNTT – ĐHCN

TP.HCM

Thư ký

1.4. Đơn vị chủ trì: Khoa Công nghệ Thông tin

1.5. Thời gian thực hiện:

1.5.1. Theo hợp đồng: từ tháng 03 năm 2020 đến tháng 03 năm 2021

1.5.2. Gia hạn (nếu có): đến tháng….. năm…..

1.5.3. Thực hiện thực tế: từ tháng 03 năm 2020 đến tháng 03 năm 2021

1.6. Những thay đổi so với thuyết minh ban đầu (nếu có):

(Về mục tiêu, nội dung, phương pháp, kết quả nghiên cứu và tổ chức thực hiện; Nguyên

nhân; Ý kiến của Cơ quan quản lý)

1.7. Tổng kinh phí được phê duyệt của đề tài: 40 triệu đồng.

II. Kết quả nghiên cứu

1. Đặt vấn đề

Khai thác mẫu tuần tự từ cơ sở dữ liệu (CSDL) chuỗi là một nhiệm vụ quan trọng trong

lĩnh khai thác dữ liệu. Một CSDL chuỗi bao gồm tập chuỗi chứa các phần tử

(elements), hoặc các sự kiện (events) được sắp xếp theo thứ tự, trong đó, một mẫu tuần

tự (sequential pattern) là một chuỗi con chứa các itemset xuất hiện phổ biến có trình tự,

tất cả các item trong cùng một itemset được giả sử là chúng có cùng tại thời điểm giao

dịch hoặc chúng có trong cùng một khoảng thời gian giao dịch, thông thường tất cả các

giao dịch của một khách hàng được gắn kết với nhau theo trình tự thời gian và được

xem là một chuỗi. Do đó, bài toán khai thác mẫu tuần tự trên CSDL chuỗi là khai thác

các chuỗi con phổ biến để tìm kiếm mối liên quan giữa các item khác nhau trong

CSDL, với yêu cầu là các mẫu phổ biến là những chuỗi con trong CSDL chuỗi mà sự

xuất hiện của chúng lớn hơn ngưỡng hỗ trợ nhỏ nhất do người dùng chỉ định hay nói

cách khác, bài toán khai thác mẫu tuần tự từ CSDL chuỗi là để tìm ra tập các chuỗi con

Tải ngay đi em, còn do dự, trời tối mất!