Thư viện tri thức trực tuyến
Kho tài liệu với 50,000+ tài liệu học thuật
© 2023 Siêu thị PDF - Kho tài liệu học thuật hàng đầu Việt Nam

Phân Tích Quan Điểm Trong Lĩnh Vực Thức Ăn Trẻ Em Sử Dụng Kỹ Thuật Học Máy
Nội dung xem thử
Mô tả chi tiết
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
NGUYỄN THỊ LIÊN
PHÂN TÍCH QUAN ĐIỂM TRONG LĨNH VỰC THỨC ĂN TRẺ EM
SỬ DỤNG KỸ THUẬT HỌC MÁY
LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN
NGƯỜI HƯỚNG DẪN KHOA HỌC: TS. NGUYỄN VĂN VINH
Hà Nội 2021
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
NGUYỄN THỊ LIÊN
PHÂN TÍCH QUAN ĐIỂM TRONG LĨNH VỰC THỨC ĂN TRẺ
EM SỬ DỤNG KỸ THUẬT HỌC MÁY
NGÀNH: CÔNG NGHỆ THÔNG TIN
CHUYÊN NGÀNH: HỆ THỐNG THÔNG TIN
MÃ SỐ: 60480104
LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN
NGƯỜI HƯỚNG DẪN KHOA HỌC: TS. NGUYỄN VĂN VINH
Hà Nội 2021
MỤC LỤC
DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT.......................................... v
DANH MỤC CÁC BẢNG BIỂU ........................................................................ vi
DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ............................................................. vii
LỜI CAM ĐOAN…….......................................................................................viii
LỜI CẢM ƠN………. ......................................................................................... ix
MỞ ĐẦU……………........................................................................................... 1
1. Lý do chọn đề tài................................................................................. 1
2. Mục tiêu và nhiệm vụ của luận văn .................................................... 2
3. Bố cục luận văn................................................................................... 2
CHƯƠNG 1: TỔNG QUAN VỀ BÀI TOÁN PHÂN TÍCH QUAN ĐIỂM ........ 3
1.1. Giới thiệu.......................................................................................... 3
1.2. Định nghĩa và khái niệm trong phân tích quan điểm....................... 4
1.2.1. Các thành phần của một quan điểm .......................................... 4
1.2.2. Các nhiệm vụ của phân tích quan điểm .................................... 7
1.3. Những thách thức trong lĩnh vực phân tích quan điểm.................. 10
1.4. Các ứng dụng của phân tích quan điểm......................................... 12
1.5. Phân lớp quan điểm........................................................................ 13
Kết luận chương.................................................................................... 14
CHƯƠNG 2: CÁC KỸ THUẬT HỌC MÁY TRONG BÀI TOÁN PHÂN TÍCH
QUAN ĐIỂM ......................................................................................... 15
2.1. Các phương pháp tiếp cận của phân tích quan điểm...................... 15
2.1.1. Phương pháp tiếp cận dựa trên luật......................................... 15
2.1.2. Phương pháp tiếp cận dựa vào học máy ................................. 16
2.2. Phương pháp Naïve Bayes............................................................ 16
2.3. Phương pháp Support Vector Machine (SVM) ............................. 18
2.4. Phương pháp Hồi quy Logistic (Logistic regression).................... 21
2.4.1. Giới thiệu................................................................................. 21
2.4.2. Mô hình Logistic ..................................................................... 21
2.4.3. Hàm Logistic và các tỉ lệ......................................................... 23
2.5. Phương pháp tiếp cận học sâu (Deep Learning)............................ 25
2.5.1. Mạng Neural hồi quy RNN..................................................... 26
2.5.2. Mạng Long Short-Term Memory ........................................... 28
Kết luận chương.................................................................................... 32
CHƯƠNG 3: ỨNG DỤNG PHÂN TÍCH QUAN ĐIỂM VỚI DỮ LIỆU THỨC
ĂN TRẺ EM ......................................................................................... 33
3.1. Hệ thống phân tích quan điểm ....................................................... 33
3.2. Đặc điểm của dữ liệu thức ăn trẻ em.............................................. 34
3.3. Tiền xử lý dữ liệu và gán nhãn....................................................... 35
3.3.1. Tiền xử lý dữ liệu.................................................................... 35
3.3.2. Gán nhãn dữ liệu ..................................................................... 36
3.4. Trích chọn đặc trưng ...................................................................... 39
3.5. Xây dựng và lựa chọn mô hình...................................................... 41
3.6. Phương pháp đánh giá mô hình ..................................................... 42
CHƯƠNG 4: THỰC NGHIỆM VÀ ĐÁNH GIÁ............................................... 45
4.1. Môi trường thực nghiệm: ............................................................... 45
4.2. Xây dựng và lựa chọn mô hình...................................................... 45
4.3. Huấn luyện mô hình....................................................................... 48
4.4. Kết quả thực nghiệm...................................................................... 48
4.5. Đánh giá thực nghiệm.................................................................... 51
Kết luận chương……………………………………………………….52
KẾT LUẬN………………................................................................................. 53
Tài liệu tham khảo…........................................................................................... 54
v
DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT
Viết tắt Đầy đủ tiếng anh Ý nghĩa tiếng việt
ACC Accuracy
Độ chính xác trung bình các
thuật toán
BOW Bag of word Túi từ
LSTM Long Short Term Memory Mạng bộ nhớ thuật ngữ ngắn
dài
NLP Natural Language Processing Xử lý ngôn ngữ tự nhiên
OA Opinion analysis Phân tích quan điểm
SA Sentiment Analysis Phân tích cảm xúc
SVM Support Vector Machine Máy véc-tơ hỗ trợ
TF-IDF
Term Frequency – Inverse
Document Frequency
Tần suất tài liệu nghịch đảo
thuật ngữ
vi
DANH MỤC CÁC BẢNG BIỂU
Bảng 3. 1: Một số từ dừng trong tiếng Việt................................................ 36
Bảng 4. 1: Kết quả huấn luyện mô hình với độ đo ACC............................ 48
Bảng 4. 2: Kết quả độ chính xác theo cỡ của dữ liệu huấn luyện ............. 49
Bảng 4. 3: Thời gian huấn luyện của các tập dữ liệu.................................. 50