Thư viện tri thức trực tuyến
Kho tài liệu với 50,000+ tài liệu học thuật
© 2023 Siêu thị PDF - Kho tài liệu học thuật hàng đầu Việt Nam
Xây dựng hệ thống chatbot sử dụng Google bert trong lĩnh vực du lịch Việt Nam
Nội dung xem thử
Mô tả chi tiết
2
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC MỞ THÀNH PHỐ HỒ CHÍ MINH
--------∞0∞--------
TRẦN DUY LUÂN
XÂY DỰNG HỆ THỐNG CHATBOT
SỬ DỤNG GOOGLE BERT
TRONG LĨNH VỰC DU LỊCH VIỆT NAM
Chuyên ngành: Khoa học máy tính
Mã số chuyên ngành: 60 48 01 01
LUẬN VĂN THẠC SĨ
KHOA HỌC MÁY TÍNH
Giảng viên hướng dẫn: PGS.TS ĐỖ PHÚC
TP. HỒ CHÍ MINH, NĂM 2021
iii
TRƯỜNG ĐẠI HỌC MỞ
THÀNH PHỐ HỒ CHÍ MINH
KHOA ĐÀO TẠO SAU ĐẠI HỌC
CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM
Độc lập – Tự do – Hạnh phúc
GIẤY XÁC NHẬN
Tôi tên là: Trần Duy Luân
Ngày sinh: 13/11/1994 Nơi sinh: TP.HCM
Chuyên ngành: Khoa học máy tính Mã học viên: 1784801010025
Tôi đồng ý cung cấp toàn văn thông tin luận văn tốt nghiệp hợp lệ về bản quyền
cho Thư viện trường đại học Mở Thành phố Hồ Chí Minh. Thư viện trường đại học
Mở Thành phố Hồ Chí Minh sẽ kết nối toàn văn thông tin luận văn tốt nghiệp vào hệ
thống thông tin khoa học của Sở Khoa học và Công nghệ Thành phố Hồ Chí Minh.
Ký tên
(Ghi rõ họ và tên)
iv
CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM
Độc lập – Tự do – Hạnh phúc
Ý KIẾN CHO PHÉP BẢO VỆ LUẬN VĂN THẠC SĨ
CỦA GIẢNG VIÊN HƯỚNG DẪN
Giảng viên hướng dẫn: PGS.TS. Đỗ Phúc
Học viên thực hiện: Trần Duy Luân Lớp: MCOM017B
Ngày sinh: 13/11/1994 Nơi sinh: Thành phố Hồ Chí Minh
Tên đề tài: Xây dựng hệ thống Chatbot sử dụng Google BERT trong lĩnh vực du
lịch Việt Nam.
Ý kiến của giáo viên hướng dẫn về việc cho phép học viên Trần Duy Luân được
bảo vệ luận văn trước Hội đồng:
Học viên Trần Duy Luận đã hoàn tất các công việc được giao. Tôi đồng ý cho học
viên được phép bảo vệ.
Kính đề nghị nhà trường xem xét.
Thành phố Hồ Chí Minh, ngày 02 tháng 08 năm 2021
Người nhận xét
PGS.TS. Đỗ Phúc
v
LỜI CAM ĐOAN
Tôi cam đoan rằng luận văn “Xây dựng hệ thống Chatbot sử dụng
Google BERT trong lĩnh vực du lịch Việt Nam” là bài nghiên cứu của chính
tôi. Ngoại trừ những tài liệu tham khảo được trích dẫn trong luận văn này, tôi
cam đoan rằng toàn phần hay những phần nhỏ của luận văn này chưa từng được
công bố hoặc được sử dụng để nhận bằng cấp ở những nơi khác.
Không có sản phẩm/nghiên cứu nào của người khác được sử dụng trong
luận văn này mà không được trích dẫn theo đúng quy định. Luận văn này chưa
bao giờ được nộp để nhận bất kỳ bằng cấp nào tại các trường đại học hoặc cơ
sở đào tạo khác.
Tp. Hồ Chí Minh, ngày 02 tháng 08 năm 2021
TÁC GIẢ LUẬN VĂN
Trần Duy Luân
vi
LỜI CẢM ƠN
Trước tiên, tôi xin chân thành gửi lời cám ơn đến trường Đại học Mở
Thành phố Hồ Chí Minh đã tạo điều kiện cho tôi được thực hiện đề tài “Xây
dựng Chatbot sử dụng Google BERT trong lĩnh vực du lịch Việt Nam”.
Đặc biệt hơn, tôi cũng muốn gửi lời cảm ơn đến PGS. TS. Đỗ Phúc,
người đã hướng dẫn tôi xuyên suốt thời gian thực hiện đề tài.
Trong quá trình thực hiện đề tài, do kiến thức và khả năng của bản thân
có giới hạn, nên chắc chắn sẽ không tránh khỏi nhiều sai sót. Vì vậy, kính mong
sự đóng góp của các thầy cô ngành Khoa học máy tính nhằm giúp đề tài này
hoàn thiện hơn.
Xin trân trọng cảm ơn.
vii
TRƯỜNG ĐẠI HỌC MỞ THÀNH PHỐ HỒ CHÍ MINH
KHOA SAU ĐẠI HỌC
¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯
TÓM TẮT LUẬN VĂN
(Dùng cho học viên và người hướng dẫn)
Đề tài: “Xây dựng hệ thống Chatbot sử dụng Google BERT trong lĩnh vực du
lịch Việt Nam”
Ngành: Khoa học máy tính Học viên: Trần Duy Luân
Người hướng dẫn: PGS. TS. Đỗ Phúc Mã số: 1784801010025
NỘI DUNG TÓM TẮT
Trải qua nhiều thập kỷ, các ứng dụng Chatbot đã phát triển rất mạnh mẽ
và đã giúp ích rất nhiều cho xã hội loài người. Nhờ vào việc tích hợp công nghệ
Trí tuệ nhân tạo nên Chatbot đã có khả năng giao tiếp với con người và có thể
thay thế con người thực hiện một số công việc nhất định. Hiện nay, Chatbot đã
và đang được áp dụng rộng rãi trong rất nhiều lĩnh vực khác nhau, và du lịch là
một trong số đó. Hiện tại những ứng dụng Chatbot dành cho du lịch rất nhiều,
tuy nhiên hầu hết vẫn chưa hỗ trợ tiếng Việt tốt, vì mà tác giả đã đề xuất đề tài
“Xây dựng hệ thống Chatbot sử dụng Google BERT trong lĩnh vực du lịch
Việt Nam”. Hệ thống mà tác giả xây dựng sẽ dựa trên các kiến thức về đồ thị
tri thức, dữ liệu được thu thập dựa trên sơ đồ mạng các bộ ba và được lưu trữ
dưới dạng đồ thị tri thức qua phần mềm quản trị Neo4j. Bên cạnh đó, tác giả
nghiên cứu về kỹ thuật hỏi đáp bằng ngôn ngữ tự nhiên, xử lý ngôn ngữ tự
nhiên thông qua thư viện UnderTheSea cũng như sử dụng phương pháp BERT
để tìm kiếm câu trả lời.
Đề tài này bao gồm 4 chương:
viii
Chương 1: Mở đầu và giới thiệu đề tài
Chương 2: Tổng quan trí tuệ nhân tạo và các phương pháp xử lý
ngôn ngữ tự nhiên.
Chương 3: Tổng quan về đồ thị tri thức.
Chương 4: Xây dựng hệ thống Chatbot
Hệ thống này được xây dựng để hỏi đáp bằng tiếng Việt, và trước mắt sẽ
xử lý các câu hỏi về du lịch của thành phố Hồ Chi Minh thông qua giao diện
web. Hướng phát triển của đề tài này có thể xây dựng hệ thống Chatbot cao cấp
hơn với các câu hỏi phức tạp hơn và có áp dụng cho các lĩnh vực khác ngoài
du lịch.
TP.Hồ Chí Minh, ngày 02 tháng 08 năm 2021
NGƯỜI HƯỚNG DẪN HỌC VIÊN
PGS. TS. Đỗ Phúc Trần Duy Luân
ix
HO CHI MINH CITY OPEN UNIVERSITY
POST-GRADUATE FACULTY
¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯
TÓM TẮT LUẬN VĂN (TIẾNG ANH)
THESIS SUMMARY
(For students and instructors)
Subject: “Building a Chatbot using Google BERT regarding to Vietnam
tourism”
Major: Computer Science Student: Luan Tran Duy
Instructor: Assoc. Pro. Ph.D Do Phuc Student code: 1784801010025
SUMMARY CONTENT
Over the decades, Chatbot applications have developed very strongly
and have greatly helped human society. Thanks to the integration of Artificial
Intelligence technology, Chatbot has the ability to communicate with humans
and can replace humans to perform certain tasks. Currently, Chatbot has been
widely applied in many different fields, and tourism is one of them. Currently,
there are many Chatbot applications for tourism, but most of them still do not
support Vietnamese well, therefore, the author proposed the topic “Building a
Chatbot using Google BERT regarding to Vietnam tourism”. The system
that the author builds is based on knowledge of knowledge graphs, the data is
collected based on network diagrams of triplets and stored in the form of
knowledge graphs via Neo4j management software. In addition, the author
researches on natural language questioning and answering techniques, natural
language processing through the UnderTheSea library as well as using BERT
method to search for answers. This thesis consists of 4 chapters:
x
Chapter 1: Thesis introduction.
Chapter 2: Overview of Artificial Intelligence and Natural
Language Processing methods.
Chapter 3: Overview of Knowledge graph.
Chapter 4: Building the Chatbot system.
This system is built to answer questions in Vietnamese, and in the
immediate future, it handles questions regarding tourism in Ho Chi Minh City
through a web interface. The future development of the Chatbot will be a more
advanced Chatbot system with more complex questions and can be applied to
other fields besides tourism.
Ho Chi Minh City, August 2nd, 2021
INSTRUCTOR STUDENT
Assoc. Pro. Ph.D Do Phuc Luan Tran Duy
xi
MỤC LỤC
Trang
LỜI CAM ĐOAN ............................................................................................. v
LỜI CẢM ƠN ..................................................................................................vi
TÓM TẮT LUẬN VĂN .................................................................................vii
TÓM TẮT LUẬN VĂN (TIẾNG ANH).........................................................ix
MỤC LỤC........................................................................................................xi
DANH MỤC HÌNH ẢNH .............................................................................xiv
DANH MỤC BẢNG......................................................................................xvi
DANH MỤC THUẬT NGỮ VÀ TỪ VIẾT TẮT ........................................xvii
Chương 1: MỞ ĐẦU......................................................................................... 1
1.1. Giới thiệu................................................................................................ 1
1.2. Mục tiêu của đề tài ................................................................................. 3
1.3. Phạm vi và đối tượng nghiên cứu........................................................... 3
1.4. Nội dung thực hiện ................................................................................. 3
1.5. Phương pháp thực hiện........................................................................... 4
1.6. Ý nghĩa của đề tài................................................................................... 4
Chương 2: TỔNG QUAN VỀ TRÍ TUỆ NHÂN TẠO VÀ CÁC PHƯƠNG
PHÁP XỬ LÝ NGÔN NGỮ TỰ NHIÊN......................................................... 5
2.1. Đôi nét về AI .......................................................................................... 5
2.1.1. Khái lược ......................................................................................... 5
2.1.2. Lịch sử phát triển............................................................................. 6
2.1.3. Ứng dụng của AI ............................................................................. 7