Siêu thị PDFTải ngay đi em, trời tối mất

Thư viện tri thức trực tuyến

Kho tài liệu với 50,000+ tài liệu học thuật

© 2023 Siêu thị PDF - Kho tài liệu học thuật hàng đầu Việt Nam

Sử dụng cơ sở dữ liệu đồ thị trong hệ gợi ý
PREMIUM
Số trang
78
Kích thước
2.2 MB
Định dạng
PDF
Lượt xem
1484

Sử dụng cơ sở dữ liệu đồ thị trong hệ gợi ý

Nội dung xem thử

Mô tả chi tiết

BỘ GIÁO DỤC VÀ ĐÀO TẠO

TRƢỜNG ĐẠI HỌC QUY NHƠN

LÊ QUYỀN

SỬ DỤNG CƠ SỞ DỮ LIỆU ĐỒ THỊ

TRONG HỆ GỢI Ý

Chuyên ngành: Khoa Học Máy Tính

Mã số: 8 48 01 01

Ngƣời hƣớng dẫn: TS. TRẦN THIÊN THÀNH

LỜI CAM ĐOAN

Tôi xin cam đoan những kết quả đƣợc trình bày trong luận văn này là

của riêng tôi, không sao chép từ bất kỳ một công trình nào khác. Nếu có điều

gì không trung thực, tôi xin chịu hoàn toàn trách nhiệm.

HỌC VIÊN

LÊ QUYỀN

LỜI CẢM ƠN

Lời đầu tiên, cho phép tôi gửi lời cảm ơn đến TS. TRẦN THIÊN

THÀNH, người thầy đã luôn quan tâm giúp đỡ, hướng dẫn, chỉ bảo tận tình

giúp tôi hoàn thành luận văn này.

Tôi xin chân thành cảm ơn Quý Thầy Cô trong Khoa Công nghệ thông

tin trường Đại Học Quy Nhơn vì những kiến thức mà quý Thầy Cô truyền đạt

cho tôi trong suốt quá trình học tập tại trường.

Xin chân thành cảm ơn các anh chị em lớp cao học Khoa học máy

tính khoá 2019 – 2021 (K22) và các bạn đồng nghiệp đã luôn bên cạnh, động

viên, khuyến khích tôi trong suốt thời gian học tập và thực hiện đề tài.

Cuối cùng, tôi xin gửi đến gia đình, chính từ sự hỗ trợ và động viên từ

phía gia đình mà tôi yên tâm học tập tốt và hoàn thành luận văn.

Xin chân thành cảm ơn!

NGƢỜI THỰC HIỆN

LÊ QUYỀN

MỤC LỤC

LỜI CAM ĐOAN

LỜI CẢM ƠN

DANH MỤC CÁC THUẬT NGỮ, TỪ VIẾT TẮT

DANH MỤC CÁC BẢNG

DANH MỤC CÁC HÌNH VẼ

MỞ ĐẦU.......................................................................................................... 1

1. Lý do chọn đề tài.................................................................................... 1

2. Mục đ ch và nhiệm vụ nghi n cứu ......................................................... 1

3. Đối tƣợng và phạm vi nghiên cứu .......................................................... 1

4. Phƣơng pháp nghiên cứu........................................................................ 2

5. Nội dung nghiên cứu .............................................................................. 2

CHƢƠNG I. TỔNG QUAN............................................................................. 3

1.1. Cơ sở dữ liệu đồ thị ............................................................................. 3

1.1.1. Khái niệm đồ thị........................................................................... 3

1.1.2. Cơ sở dữ liệu đồ thị (Graph Database)......................................... 8

1.1.3. Một số ứng dụng của cơ sở dữ liệu đồ thị.................................. 18

1.2. Cơ sở dữ liệu đồ thị Neo4j ................................................................ 20

1.2.1. Giới thiệu chung......................................................................... 20

1.2.2. Mô hình dữ liệu .......................................................................... 21

1.2.3. Ngôn ngữ truy vấn Cypher......................................................... 23

1.2.4. Python với Neo4j Desktop ........................................................ 28

1.2.5. Chỉ mục (Indexing) .................................................................... 29

1.3. Tổng quan về hệ thống gợi ý............................................................. 33

1.3.1. Giới thiệu chung......................................................................... 33

1.3.2. Ứng dụng của hệ thống gợi ý ..................................................... 36

1.3.3. Bài toán gợi ý ............................................................................. 37

1.4. Một số phƣơng pháp gợi ý................................................................. 38

1.4.1. Phƣơng pháp Gợi ý dựa trên Nội dung (Content-based)............ 39

1.4.2. Collaborative filtering - CF (lọc cộng tác)................................. 39

1.4.3. Hybrid approach (các phƣơng pháp lai)..................................... 46

1.5. Tiểu kết chƣơng 1.............................................................................. 47

CHƢƠNG 2. XÂY DỰNG HỆ GỢI Ý SỬ DỤNG NEO4J .......................... 48

2.1. Xây dựng cơ sở dữ liệu...................................................................... 48

2.1.1. Tổ chức dữ liệu Neo4j cho hệ gợi ý đơn giản............................ 48

2.1.2. Nạp dữ liệu từ csv vào Neo4j..................................................... 49

2.2. Thuật toán tính dự đoán rating bằng Cosin, Pearson......................... 49

2.2.1. Thuật toán sử dụng tƣơng quan Pearson ................................... 49

2.2.2. Thuật toán sử dụng độ tƣơng tự Cosin ...................................... 50

2.2.3. Thuật toán gợi ý k-sản phẩm ..................................................... 51

2.3. Các thuật toán đánh giá độ chính xác................................................ 53

2.3.1. Đánh giá dự đoán xếp hạng sản phẩm ....................................... 53

2.3.2. Đánh giá gợi ý sản phẩm ........................................................... 56

2.4. Tiểu kết chƣơng 2.............................................................................. 59

CHƢƠNG 3. THỰC NGHIỆM...................................................................... 61

3.1. Công cụ thực nghiệm......................................................................... 61

3.2. Thực nghiệm...................................................................................... 63

3.3. Phân tích kết quả thực nghiệm .......................................................... 65

KẾT LUẬN .................................................................................................... 66

DANH MỤC TÀI LIỆU THAM KHẢO ....................................................... 68

QUYẾT ĐỊNH GIAO ĐỀ TÀI LUẬN VĂN THẠC SĨ (BẢN SAO)

DANH MỤC CÁC THUẬT NGỮ, TỪ VIẾT TẮT

KÝ HIỆU

DIỄN GIẢI

TIẾNG ANH TIẾNG VIỆT

RS

Recommender System /

Recommendation System

Hệ tƣ vấn/Hệ gợi ý

CF Collaborative Filtering Lọc cộng tác

CBF Content-Based Filtering Lọc theo nội dung

HF Hybrid Filtering Lọc kết hợp

MAE Mean Absolute Error Trung bình giá trị tuyệt đối lỗi

RMSE Root Mean Square Error Trung bình lỗi lấy căn

KNN K-Nearest Neighbor K láng giềng gần nhất

SDP Sparsity Data Problem Vấn đề dữ liệu thƣa

User-Based k￾NN

User-Based k Neareast

Neighbor

Phƣơng pháp K láng giềng

gần nhất dựa vào ngƣời dùng

Item-Based k￾NN

Item-Based k Neareast

Neighbor

Phƣơng pháp K láng giềng

gần nhất dựa vào sản phẩm

U Users

Chỉ những ngƣời dùng hệ

thống để tìm kiếm lựa chọn

sản phẩm

I Items

Chỉ những sản phẩm trên hệ

thống nhƣ: sản phẩm, phim,

ảnh, bản nhạc, trang web,

đoạn văn bản,…

R Rating

Chỉ mức độ đánh giá của một

ngƣời dùng với một sản phẩm.

Rating có thể có nhiều dạng

biểu diễn: nhị phân (thích

hoặc không th ch), hay đánh

giá theo mức độ từ 1-5 ―dấu

sao‖ đại diện 5 mức độ từ

không th ch đến rất th ch…

CSDL Database Cơ sở dữ liệu

NNLT Programming language Ngôn ngữ lập trình

Tải ngay đi em, còn do dự, trời tối mất!