Siêu thị PDFTải ngay đi em, trời tối mất

Thư viện tri thức trực tuyến

Kho tài liệu với 50,000+ tài liệu học thuật

© 2023 Siêu thị PDF - Kho tài liệu học thuật hàng đầu Việt Nam

T
PREMIUM
Số trang
102
Kích thước
3.2 MB
Định dạng
PDF
Lượt xem
914

Xây dựng hệ thống chatbot sử dụng Google bert trong lĩnh vực du lịch Việt Nam

Nội dung xem thử

Mô tả chi tiết

2

BỘ GIÁO DỤC VÀ ĐÀO TẠO

TRƯỜNG ĐẠI HỌC MỞ THÀNH PHỐ HỒ CHÍ MINH

--------∞0∞--------

TRẦN DUY LUÂN

XÂY DỰNG HỆ THỐNG CHATBOT

SỬ DỤNG GOOGLE BERT

TRONG LĨNH VỰC DU LỊCH VIỆT NAM

Chuyên ngành: Khoa học máy tính

Mã số chuyên ngành: 60 48 01 01

LUẬN VĂN THẠC SĨ

KHOA HỌC MÁY TÍNH

Giảng viên hướng dẫn: PGS.TS ĐỖ PHÚC

TP. HỒ CHÍ MINH, NĂM 2021

iii

TRƯỜNG ĐẠI HỌC MỞ

THÀNH PHỐ HỒ CHÍ MINH

KHOA ĐÀO TẠO SAU ĐẠI HỌC

CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM

Độc lập – Tự do – Hạnh phúc

GIẤY XÁC NHẬN

Tôi tên là: Trần Duy Luân

Ngày sinh: 13/11/1994 Nơi sinh: TP.HCM

Chuyên ngành: Khoa học máy tính Mã học viên: 1784801010025

Tôi đồng ý cung cấp toàn văn thông tin luận văn tốt nghiệp hợp lệ về bản quyền

cho Thư viện trường đại học Mở Thành phố Hồ Chí Minh. Thư viện trường đại học

Mở Thành phố Hồ Chí Minh sẽ kết nối toàn văn thông tin luận văn tốt nghiệp vào hệ

thống thông tin khoa học của Sở Khoa học và Công nghệ Thành phố Hồ Chí Minh.

Ký tên

(Ghi rõ họ và tên)

iv

CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM

Độc lập – Tự do – Hạnh phúc

Ý KIẾN CHO PHÉP BẢO VỆ LUẬN VĂN THẠC SĨ

CỦA GIẢNG VIÊN HƯỚNG DẪN

Giảng viên hướng dẫn: PGS.TS. Đỗ Phúc

Học viên thực hiện: Trần Duy Luân Lớp: MCOM017B

Ngày sinh: 13/11/1994 Nơi sinh: Thành phố Hồ Chí Minh

Tên đề tài: Xây dựng hệ thống Chatbot sử dụng Google BERT trong lĩnh vực du

lịch Việt Nam.

Ý kiến của giáo viên hướng dẫn về việc cho phép học viên Trần Duy Luân được

bảo vệ luận văn trước Hội đồng:

Học viên Trần Duy Luận đã hoàn tất các công việc được giao. Tôi đồng ý cho học

viên được phép bảo vệ.

Kính đề nghị nhà trường xem xét.

Thành phố Hồ Chí Minh, ngày 02 tháng 08 năm 2021

Người nhận xét

PGS.TS. Đỗ Phúc

v

LỜI CAM ĐOAN

Tôi cam đoan rằng luận văn “Xây dựng hệ thống Chatbot sử dụng

Google BERT trong lĩnh vực du lịch Việt Nam” là bài nghiên cứu của chính

tôi. Ngoại trừ những tài liệu tham khảo được trích dẫn trong luận văn này, tôi

cam đoan rằng toàn phần hay những phần nhỏ của luận văn này chưa từng được

công bố hoặc được sử dụng để nhận bằng cấp ở những nơi khác.

Không có sản phẩm/nghiên cứu nào của người khác được sử dụng trong

luận văn này mà không được trích dẫn theo đúng quy định. Luận văn này chưa

bao giờ được nộp để nhận bất kỳ bằng cấp nào tại các trường đại học hoặc cơ

sở đào tạo khác.

Tp. Hồ Chí Minh, ngày 02 tháng 08 năm 2021

TÁC GIẢ LUẬN VĂN

Trần Duy Luân

vi

LỜI CẢM ƠN

Trước tiên, tôi xin chân thành gửi lời cám ơn đến trường Đại học Mở

Thành phố Hồ Chí Minh đã tạo điều kiện cho tôi được thực hiện đề tài “Xây

dựng Chatbot sử dụng Google BERT trong lĩnh vực du lịch Việt Nam”.

Đặc biệt hơn, tôi cũng muốn gửi lời cảm ơn đến PGS. TS. Đỗ Phúc,

người đã hướng dẫn tôi xuyên suốt thời gian thực hiện đề tài.

Trong quá trình thực hiện đề tài, do kiến thức và khả năng của bản thân

có giới hạn, nên chắc chắn sẽ không tránh khỏi nhiều sai sót. Vì vậy, kính mong

sự đóng góp của các thầy cô ngành Khoa học máy tính nhằm giúp đề tài này

hoàn thiện hơn.

Xin trân trọng cảm ơn.

vii

TRƯỜNG ĐẠI HỌC MỞ THÀNH PHỐ HỒ CHÍ MINH

KHOA SAU ĐẠI HỌC

¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯

TÓM TẮT LUẬN VĂN

(Dùng cho học viên và người hướng dẫn)

Đề tài: “Xây dựng hệ thống Chatbot sử dụng Google BERT trong lĩnh vực du

lịch Việt Nam”

Ngành: Khoa học máy tính Học viên: Trần Duy Luân

Người hướng dẫn: PGS. TS. Đỗ Phúc Mã số: 1784801010025

NỘI DUNG TÓM TẮT

Trải qua nhiều thập kỷ, các ứng dụng Chatbot đã phát triển rất mạnh mẽ

và đã giúp ích rất nhiều cho xã hội loài người. Nhờ vào việc tích hợp công nghệ

Trí tuệ nhân tạo nên Chatbot đã có khả năng giao tiếp với con người và có thể

thay thế con người thực hiện một số công việc nhất định. Hiện nay, Chatbot đã

và đang được áp dụng rộng rãi trong rất nhiều lĩnh vực khác nhau, và du lịch là

một trong số đó. Hiện tại những ứng dụng Chatbot dành cho du lịch rất nhiều,

tuy nhiên hầu hết vẫn chưa hỗ trợ tiếng Việt tốt, vì mà tác giả đã đề xuất đề tài

“Xây dựng hệ thống Chatbot sử dụng Google BERT trong lĩnh vực du lịch

Việt Nam”. Hệ thống mà tác giả xây dựng sẽ dựa trên các kiến thức về đồ thị

tri thức, dữ liệu được thu thập dựa trên sơ đồ mạng các bộ ba và được lưu trữ

dưới dạng đồ thị tri thức qua phần mềm quản trị Neo4j. Bên cạnh đó, tác giả

nghiên cứu về kỹ thuật hỏi đáp bằng ngôn ngữ tự nhiên, xử lý ngôn ngữ tự

nhiên thông qua thư viện UnderTheSea cũng như sử dụng phương pháp BERT

để tìm kiếm câu trả lời.

Đề tài này bao gồm 4 chương:

viii

Chương 1: Mở đầu và giới thiệu đề tài

Chương 2: Tổng quan trí tuệ nhân tạo và các phương pháp xử lý

ngôn ngữ tự nhiên.

Chương 3: Tổng quan về đồ thị tri thức.

Chương 4: Xây dựng hệ thống Chatbot

Hệ thống này được xây dựng để hỏi đáp bằng tiếng Việt, và trước mắt sẽ

xử lý các câu hỏi về du lịch của thành phố Hồ Chi Minh thông qua giao diện

web. Hướng phát triển của đề tài này có thể xây dựng hệ thống Chatbot cao cấp

hơn với các câu hỏi phức tạp hơn và có áp dụng cho các lĩnh vực khác ngoài

du lịch.

TP.Hồ Chí Minh, ngày 02 tháng 08 năm 2021

NGƯỜI HƯỚNG DẪN HỌC VIÊN

PGS. TS. Đỗ Phúc Trần Duy Luân

ix

HO CHI MINH CITY OPEN UNIVERSITY

POST-GRADUATE FACULTY

¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯

TÓM TẮT LUẬN VĂN (TIẾNG ANH)

THESIS SUMMARY

(For students and instructors)

Subject: “Building a Chatbot using Google BERT regarding to Vietnam

tourism”

Major: Computer Science Student: Luan Tran Duy

Instructor: Assoc. Pro. Ph.D Do Phuc Student code: 1784801010025

SUMMARY CONTENT

Over the decades, Chatbot applications have developed very strongly

and have greatly helped human society. Thanks to the integration of Artificial

Intelligence technology, Chatbot has the ability to communicate with humans

and can replace humans to perform certain tasks. Currently, Chatbot has been

widely applied in many different fields, and tourism is one of them. Currently,

there are many Chatbot applications for tourism, but most of them still do not

support Vietnamese well, therefore, the author proposed the topic “Building a

Chatbot using Google BERT regarding to Vietnam tourism”. The system

that the author builds is based on knowledge of knowledge graphs, the data is

collected based on network diagrams of triplets and stored in the form of

knowledge graphs via Neo4j management software. In addition, the author

researches on natural language questioning and answering techniques, natural

language processing through the UnderTheSea library as well as using BERT

method to search for answers. This thesis consists of 4 chapters:

x

Chapter 1: Thesis introduction.

Chapter 2: Overview of Artificial Intelligence and Natural

Language Processing methods.

Chapter 3: Overview of Knowledge graph.

Chapter 4: Building the Chatbot system.

This system is built to answer questions in Vietnamese, and in the

immediate future, it handles questions regarding tourism in Ho Chi Minh City

through a web interface. The future development of the Chatbot will be a more

advanced Chatbot system with more complex questions and can be applied to

other fields besides tourism.

Ho Chi Minh City, August 2nd, 2021

INSTRUCTOR STUDENT

Assoc. Pro. Ph.D Do Phuc Luan Tran Duy

xi

MỤC LỤC

Trang

LỜI CAM ĐOAN ............................................................................................. v

LỜI CẢM ƠN ..................................................................................................vi

TÓM TẮT LUẬN VĂN .................................................................................vii

TÓM TẮT LUẬN VĂN (TIẾNG ANH).........................................................ix

MỤC LỤC........................................................................................................xi

DANH MỤC HÌNH ẢNH .............................................................................xiv

DANH MỤC BẢNG......................................................................................xvi

DANH MỤC THUẬT NGỮ VÀ TỪ VIẾT TẮT ........................................xvii

Chương 1: MỞ ĐẦU......................................................................................... 1

1.1. Giới thiệu................................................................................................ 1

1.2. Mục tiêu của đề tài ................................................................................. 3

1.3. Phạm vi và đối tượng nghiên cứu........................................................... 3

1.4. Nội dung thực hiện ................................................................................. 3

1.5. Phương pháp thực hiện........................................................................... 4

1.6. Ý nghĩa của đề tài................................................................................... 4

Chương 2: TỔNG QUAN VỀ TRÍ TUỆ NHÂN TẠO VÀ CÁC PHƯƠNG

PHÁP XỬ LÝ NGÔN NGỮ TỰ NHIÊN......................................................... 5

2.1. Đôi nét về AI .......................................................................................... 5

2.1.1. Khái lược ......................................................................................... 5

2.1.2. Lịch sử phát triển............................................................................. 6

2.1.3. Ứng dụng của AI ............................................................................. 7

Tải ngay đi em, còn do dự, trời tối mất!