Thư viện tri thức trực tuyến
Kho tài liệu với 50,000+ tài liệu học thuật
© 2023 Siêu thị PDF - Kho tài liệu học thuật hàng đầu Việt Nam

Sử dụng cơ sở dữ liệu đồ thị trong hệ gợi ý
Nội dung xem thử
Mô tả chi tiết
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƢỜNG ĐẠI HỌC QUY NHƠN
LÊ QUYỀN
SỬ DỤNG CƠ SỞ DỮ LIỆU ĐỒ THỊ
TRONG HỆ GỢI Ý
Chuyên ngành: Khoa Học Máy Tính
Mã số: 8 48 01 01
Ngƣời hƣớng dẫn: TS. TRẦN THIÊN THÀNH
LỜI CAM ĐOAN
Tôi xin cam đoan những kết quả đƣợc trình bày trong luận văn này là
của riêng tôi, không sao chép từ bất kỳ một công trình nào khác. Nếu có điều
gì không trung thực, tôi xin chịu hoàn toàn trách nhiệm.
HỌC VIÊN
LÊ QUYỀN
LỜI CẢM ƠN
Lời đầu tiên, cho phép tôi gửi lời cảm ơn đến TS. TRẦN THIÊN
THÀNH, người thầy đã luôn quan tâm giúp đỡ, hướng dẫn, chỉ bảo tận tình
giúp tôi hoàn thành luận văn này.
Tôi xin chân thành cảm ơn Quý Thầy Cô trong Khoa Công nghệ thông
tin trường Đại Học Quy Nhơn vì những kiến thức mà quý Thầy Cô truyền đạt
cho tôi trong suốt quá trình học tập tại trường.
Xin chân thành cảm ơn các anh chị em lớp cao học Khoa học máy
tính khoá 2019 – 2021 (K22) và các bạn đồng nghiệp đã luôn bên cạnh, động
viên, khuyến khích tôi trong suốt thời gian học tập và thực hiện đề tài.
Cuối cùng, tôi xin gửi đến gia đình, chính từ sự hỗ trợ và động viên từ
phía gia đình mà tôi yên tâm học tập tốt và hoàn thành luận văn.
Xin chân thành cảm ơn!
NGƢỜI THỰC HIỆN
LÊ QUYỀN
MỤC LỤC
LỜI CAM ĐOAN
LỜI CẢM ƠN
DANH MỤC CÁC THUẬT NGỮ, TỪ VIẾT TẮT
DANH MỤC CÁC BẢNG
DANH MỤC CÁC HÌNH VẼ
MỞ ĐẦU.......................................................................................................... 1
1. Lý do chọn đề tài.................................................................................... 1
2. Mục đ ch và nhiệm vụ nghi n cứu ......................................................... 1
3. Đối tƣợng và phạm vi nghiên cứu .......................................................... 1
4. Phƣơng pháp nghiên cứu........................................................................ 2
5. Nội dung nghiên cứu .............................................................................. 2
CHƢƠNG I. TỔNG QUAN............................................................................. 3
1.1. Cơ sở dữ liệu đồ thị ............................................................................. 3
1.1.1. Khái niệm đồ thị........................................................................... 3
1.1.2. Cơ sở dữ liệu đồ thị (Graph Database)......................................... 8
1.1.3. Một số ứng dụng của cơ sở dữ liệu đồ thị.................................. 18
1.2. Cơ sở dữ liệu đồ thị Neo4j ................................................................ 20
1.2.1. Giới thiệu chung......................................................................... 20
1.2.2. Mô hình dữ liệu .......................................................................... 21
1.2.3. Ngôn ngữ truy vấn Cypher......................................................... 23
1.2.4. Python với Neo4j Desktop ........................................................ 28
1.2.5. Chỉ mục (Indexing) .................................................................... 29
1.3. Tổng quan về hệ thống gợi ý............................................................. 33
1.3.1. Giới thiệu chung......................................................................... 33
1.3.2. Ứng dụng của hệ thống gợi ý ..................................................... 36
1.3.3. Bài toán gợi ý ............................................................................. 37
1.4. Một số phƣơng pháp gợi ý................................................................. 38
1.4.1. Phƣơng pháp Gợi ý dựa trên Nội dung (Content-based)............ 39
1.4.2. Collaborative filtering - CF (lọc cộng tác)................................. 39
1.4.3. Hybrid approach (các phƣơng pháp lai)..................................... 46
1.5. Tiểu kết chƣơng 1.............................................................................. 47
CHƢƠNG 2. XÂY DỰNG HỆ GỢI Ý SỬ DỤNG NEO4J .......................... 48
2.1. Xây dựng cơ sở dữ liệu...................................................................... 48
2.1.1. Tổ chức dữ liệu Neo4j cho hệ gợi ý đơn giản............................ 48
2.1.2. Nạp dữ liệu từ csv vào Neo4j..................................................... 49
2.2. Thuật toán tính dự đoán rating bằng Cosin, Pearson......................... 49
2.2.1. Thuật toán sử dụng tƣơng quan Pearson ................................... 49
2.2.2. Thuật toán sử dụng độ tƣơng tự Cosin ...................................... 50
2.2.3. Thuật toán gợi ý k-sản phẩm ..................................................... 51
2.3. Các thuật toán đánh giá độ chính xác................................................ 53
2.3.1. Đánh giá dự đoán xếp hạng sản phẩm ....................................... 53
2.3.2. Đánh giá gợi ý sản phẩm ........................................................... 56
2.4. Tiểu kết chƣơng 2.............................................................................. 59
CHƢƠNG 3. THỰC NGHIỆM...................................................................... 61
3.1. Công cụ thực nghiệm......................................................................... 61
3.2. Thực nghiệm...................................................................................... 63
3.3. Phân tích kết quả thực nghiệm .......................................................... 65
KẾT LUẬN .................................................................................................... 66
DANH MỤC TÀI LIỆU THAM KHẢO ....................................................... 68
QUYẾT ĐỊNH GIAO ĐỀ TÀI LUẬN VĂN THẠC SĨ (BẢN SAO)
DANH MỤC CÁC THUẬT NGỮ, TỪ VIẾT TẮT
KÝ HIỆU
DIỄN GIẢI
TIẾNG ANH TIẾNG VIỆT
RS
Recommender System /
Recommendation System
Hệ tƣ vấn/Hệ gợi ý
CF Collaborative Filtering Lọc cộng tác
CBF Content-Based Filtering Lọc theo nội dung
HF Hybrid Filtering Lọc kết hợp
MAE Mean Absolute Error Trung bình giá trị tuyệt đối lỗi
RMSE Root Mean Square Error Trung bình lỗi lấy căn
KNN K-Nearest Neighbor K láng giềng gần nhất
SDP Sparsity Data Problem Vấn đề dữ liệu thƣa
User-Based kNN
User-Based k Neareast
Neighbor
Phƣơng pháp K láng giềng
gần nhất dựa vào ngƣời dùng
Item-Based kNN
Item-Based k Neareast
Neighbor
Phƣơng pháp K láng giềng
gần nhất dựa vào sản phẩm
U Users
Chỉ những ngƣời dùng hệ
thống để tìm kiếm lựa chọn
sản phẩm
I Items
Chỉ những sản phẩm trên hệ
thống nhƣ: sản phẩm, phim,
ảnh, bản nhạc, trang web,
đoạn văn bản,…
R Rating
Chỉ mức độ đánh giá của một
ngƣời dùng với một sản phẩm.
Rating có thể có nhiều dạng
biểu diễn: nhị phân (thích
hoặc không th ch), hay đánh
giá theo mức độ từ 1-5 ―dấu
sao‖ đại diện 5 mức độ từ
không th ch đến rất th ch…
CSDL Database Cơ sở dữ liệu
NNLT Programming language Ngôn ngữ lập trình