Thư viện tri thức trực tuyến
Kho tài liệu với 50,000+ tài liệu học thuật
© 2023 Siêu thị PDF - Kho tài liệu học thuật hàng đầu Việt Nam

Nghiên cứu ứng dụng phương pháp SVM vào phân nhóm học sinh có khả năng cao vào học tại trường Đại học Kiên Giang Luận văn thạc sĩ - Chuyên ngành: Khoa học máy tính
Nội dung xem thử
Mô tả chi tiết
BỘ CÔNG THƯƠNG
TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP THÀNH PHỐ HỒ CHÍ MINH
VÕ HOÀNG NHÂN
NGHIÊN CỨU ỨNG DỤNG PHƯƠNG PHÁP
SVM VÀO PHÂN NHÓM HỌC SINH CÓ KHẢ
NĂNG CAO VÀO HỌC TẠI TRƯỜNG
ĐẠI HỌC KIÊN GIANG
Chuyên ngành: KHOA HỌC MÁY TÍNH
Mã chuyên ngành: 60 48 01 01
LUẬN VĂN THẠC SĨ
THÀNH PHỐ HỒ CHÍ MINH, NĂM 2021
Mẫu PL1
Công trình được hoàn thành tại Trường Đại học Công nghiệp TP. Hồ Chí Minh.
Người hướng dẫn khoa học: TS. Trương Khắc Tùng.
Luận văn thạc sĩ được bảo vệ tại Hội đồng chấm bảo vệ Luận văn thạc sĩ Trường Đại
học Công nghiệp thành phố Hồ Chí Minh ngày 17 tháng 10 năm 2021
Thành phần Hội đồng đánh giá luận văn thạc sĩ gồm:
1. PGS.TS. Huỳnh Trung Hiếu ...........................- Chủ tịch Hội đồng
2. TS. Lê Thành Sách..........................................- Phản biện 1
3. TS. Đặng Thị Phúc..........................................- Phản biện 2
4. TS. Trịnh Tấn Đạt ...........................................- Ủy viên
5. TS. Lê Nhật Duy .............................................- Thư ký
(Ghi rõ họ, tên, học hàm, học vị của Hội đồng chấm bảo vệ luận văn thạc sĩ)
CHỦ TỊCH HỘI ĐỒNG TRƯỞNG KHOA
CÔNG NGHỆ THÔNG TIN
NHIỆM VỤ LUẬN VĂN THẠC SĨ
Họ tên học viên: Võ Hoàng Nhân MSHV: 17112911
Ngày, tháng, năm sinh: 10/4/1993 Nơi sinh: Sóc Trăng
Chuyên ngành: Khoa học máy tính Mã chuyên ngành: 60480101
I. TÊN ĐỀ TÀI:
Nghiên cứu ứng dụng phương pháp SVM vào phân nhóm học sinh có khả năng cao
vào học tại trường Đại học Kiên Giang
NHIỆM VỤ VÀ NỘI DUNG:
- Nghiên cứu các phương pháp phân nhóm dữ liệu.
- Tiền xử lý dữ thu thập được.
- Xây dựng ứng dụng phân nhóm dữ liệu dựa vào thuậ toán SVM
- Phân tích kết quả và đưa ra hướng phát triển.
II. NGÀY GIAO NHIỆM VỤ: 06/09/2019
III. NGÀY HOÀN THÀNH NHIỆM VỤ: 17/10/2021
IV. NGƯỜI HƯỚNG DẪN KHOA HỌC: TS. Trương Khắc Tùng
Tp. Hồ Chí Minh, ngày … tháng năm 2021
NGƯỜI HƯỚNG DẪN
TS. Trương Khắc Tùng
CHỦ NHIỆM BỘ MÔN ĐÀO TẠO
TRƯỞNG KHOA CÔNG NGHỆ THÔNG TIN
BỘ CÔNG THƯƠNG
TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP
THÀNH PHỐ HỒ CHÍ MINH
CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM
Độc lập - Tự do - Hạnh phúc
i
LỜI CẢM ƠN
Để hoàn thành được bài luận văn thạc sĩ này, tôi xin bày tỏ sự cảm kích đặc biệt tới
cố vấn của tôi, Tiến sĩ Trương Khắc Tùng - Người đã định hướng, trực tiếp dẫn dắt
và cố vấn cho tôi trong suốt thời gian thực hiện đề tài nghiên cứu khoa học. Tôi xin
gửi lời cảm ơn đến thầy bằng tất cả tấm lòng và sự biết ơn của mình.
Tôi cũng xin gửi lời cảm ơn chân thành đến thầy Lê Nhật Duy – Phó khoa Công nghệ
thông tin đã hướng dẫn và giúp đỡ các biểu mẫu và quy trình hoàn thành đề tài luận
văn từ khi bắt đầu đăng ký đề cương đến khi bảo vệ luận văn.
Tôi cũng xin gửi lời cảm ơn chân thành đến thầy Lê Ngọc Sơn – Trưởng phòng Quản
lý Sau đại học và tất cả Thầy, Cô ở đây đã giúp đỡ tôi về các thủ tục cần thiết để hoàn
thành luận văn.
Sau cùng, tôi xin tỏ lòng biết ơn đến Trường Đại học Kiên Giang – Cơ quan nơi tôi
công tác, đã tạo điều kiện về thời gian, công việc để tôi có thể hoàn thành luận văn
thạc sĩ.
Xin chân thành cảm ơn tất cả mọi người!
ii
TÓM TẮT LUẬN VĂN THẠC SĨ
Việc tuyển sinh ở các trường Đại học, Cao đẳng, trung cấp chuyên nghiệp trong thời
gian gần đây là vấn đề được Lãnh đạo trường đặc biệt quan tâm. Các thay đổi quy
định của Bộ giáo dục cũng ảnh hưởng rất nhiều đến hiệu quả tuyển sinh ở các trường.
Bên cạnh đó số lượng các trường Đại học, Cao đẳng, trung cấp chuyên nghiệp được
thành lập ngày càng nhiều vì vậy quá trình tuyển sinh cũng gặp không ít khó khăn,
có rất nhiều trường do không tuyển sinh được đã giải tán hoặc sáp nhập vào các
trường lớn để duy trì hoạt động. Để đối mặt với thực tại trên ở mỗi trường luôn lập
các kế hoạch, chiến lược mới, có tính đột phá để hoàn thành chỉ tiêu của Bộ giáo dục
giao hàng năm và trường Đại học Kiên Giang là một trong số đó.
Trường Đại học Kiên Giang được thành lập theo Quyết định số 758/QĐ/TTg ngày
21/05/2014 của Thủ tướng Chính Phủ trên cơ sở Phân hiệu của Trường Đại Học Nha
Trang tại Kiên Giang. Hiện tại trường có khoảng 5000 Sinh viên theo học, hàng năm
trường được Bộ giáo dục và đào tạo giao chỉ tiêu Tuyển sinh khoảng 1000 Sinh viên.
Do trường mới thành lập nên quá trình Tuyển sinh cũng gặp rất nhiều khó khăn, đã
có nhiều phương án được đưa ra nhưng nhìn chung vẫn chưa được tối ưu.
Vì vậy trong đề tài này chúng tôi đề xuất một phương pháp giúp nhà Trường có cái
nhìn tổng quát về tình hình Tuyển sinh bằng cách phân nhóm học sinh có khả năng
cao vào học tập tại trường Đại học Kiên Giang. Để thực hiện việc này chúng tôi sử
dụng thuật toán Support Vector Machine (SVM) được cài đặt trên ngôn ngữ Python
3.6 và một số thư viện hỗ trợ khác.
iii
ABSTRACT
Student enrollment for universities, colleges, and professional secondary schools was
an issue that the school administrator pay more attention at the moment. Beside, the
enrollment regulations of the Ministry of Education and Training had changed every
year that also significantly affect on enrollment efficiency at schools. In addition, the
number of universities have been established more and more. Therefore, the
enrollment process was also fronting many difficulties. Many schools were not enroll
students that have separated or merged into large schools to maintain operations. To
face the reality situation, Kien Giang university was one of the universities which
always designs breakthrough plans and strategies to fulfill the annual target assigned
by the Ministry of Education and Training.
Kien Giang University was established under Decision No. 758/QD/TTg by the
Prime Minister dated May 21, 2014. Currently, Kien Giang University has about 5000
students. This university is assigned the target of Enrollment about 1000 students by
the Ministry of Education and Training every year. Because Kien Giang University
has been established for 7 years ago, the admission process also faced many
difficulties. Although the administrators tried to find many options, the results of the
enrollment for their university were not satisfactory.
Hence, in this current study, researcher suggested a method to contribute Kien Giang
University have an overview of the enrollment situation by grouping students with
high possibility to learn at Kien Giang University. Researcher used the Support
Vector Machine (SVM) algorithm installed on Python 3.6 language and some other
support archives.
iv
LỜI CAM ĐOAN
Tôi xin cam đoan đây là công trình nghiên cứu của bản thân tôi. Các kết quả nghiên
cứu và các kết luận trong luận văn là trung thực, không sao chép từ bất kỳ một nguồn
nào và dưới bất kỳ hình thức nào. Việc tham khảo các nguồn tài liệu (nếu có) đã được
thực hiện trích dẫn và ghi nguồn tài liệu tham khảo đúng quy định.
Học viên
Võ Hoàng Nhân
v
MỤC LỤC
LỜI CẢM ƠN ............................................................................................................. i
TÓM TẮT LUẬN VĂN THẠC SĨ............................................................................ ii
ABSTRACT.............................................................................................................. iii
LỜI CAM ĐOAN ..................................................................................................... iv
MỤC LỤC...................................................................................................................v
DANH MỤC HÌNH ẢNH ....................................................................................... vii
DANH MỤC BẢNG BIỂU .................................................................................... viii
DANH MỤC TỪ VIẾT TẮT.................................................................................... ix
MỞ ĐẦU.....................................................................................................................1
1. Đặt vấn đề ...............................................................................................................1
2. Mục tiêu nghiên cứu................................................................................................2
3. Đối tượng và phạm vi nghiên cứu...........................................................................2
4. Cách tiếp cận và phương pháp nghiên cứu .............................................................3
5. Ý nghĩa thực tiễn của đề tài.....................................................................................3
CHƯƠNG 1 TỔNG QUAN VỀ LĨNH VỰC NGHIÊN CỨU...............................4
CHƯƠNG 2 CƠ SỞ LÝ THUYẾT........................................................................6
Phân loại các thuật toán Machine learning...................................................6
2.1.1 Phân loại dựa trên phương thức học .....................................................6
2.1.2 Phân loại dựa trên chức năng................................................................7
Các thuật toán dùng để phân nhóm dữ liệu..................................................8
2.2.1 Support Vector Machine (SVM)...........................................................8
2.2.2 Máy học Naïve bayes..........................................................................14
2.2.3 Máy học cây quyết định......................................................................17
Mạng Nơ-ron ..............................................................................................22
2.3.1 Perceptrons..........................................................................................22
2.3.2 Kiến trúc mạng NN.............................................................................26
2.3.3 Lan truyền tiến ....................................................................................28
2.3.4 Học với mạng NN...............................................................................29
2.3.5 Lan truyền ngược và đạo hàm.............................................................29
2.3.6 Kết luận...............................................................................................31
Thuật toán Principal Component Analysis.................................................32