Siêu thị PDFTải ngay đi em, trời tối mất

Thư viện tri thức trực tuyến

Kho tài liệu với 50,000+ tài liệu học thuật

© 2023 Siêu thị PDF - Kho tài liệu học thuật hàng đầu Việt Nam

Nghiên cứu ứng dụng phương pháp SVM vào phân nhóm học sinh có khả năng cao vào học tại trường Đại học Kiên Giang Luận văn thạc sĩ - Chuyên ngành: Khoa học máy tính
PREMIUM
Số trang
87
Kích thước
3.6 MB
Định dạng
PDF
Lượt xem
1974

Nghiên cứu ứng dụng phương pháp SVM vào phân nhóm học sinh có khả năng cao vào học tại trường Đại học Kiên Giang Luận văn thạc sĩ - Chuyên ngành: Khoa học máy tính

Nội dung xem thử

Mô tả chi tiết

BỘ CÔNG THƯƠNG

TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP THÀNH PHỐ HỒ CHÍ MINH

VÕ HOÀNG NHÂN

NGHIÊN CỨU ỨNG DỤNG PHƯƠNG PHÁP

SVM VÀO PHÂN NHÓM HỌC SINH CÓ KHẢ

NĂNG CAO VÀO HỌC TẠI TRƯỜNG

ĐẠI HỌC KIÊN GIANG

Chuyên ngành: KHOA HỌC MÁY TÍNH

Mã chuyên ngành: 60 48 01 01

LUẬN VĂN THẠC SĨ

THÀNH PHỐ HỒ CHÍ MINH, NĂM 2021

Mẫu PL1

Công trình được hoàn thành tại Trường Đại học Công nghiệp TP. Hồ Chí Minh.

Người hướng dẫn khoa học: TS. Trương Khắc Tùng.

Luận văn thạc sĩ được bảo vệ tại Hội đồng chấm bảo vệ Luận văn thạc sĩ Trường Đại

học Công nghiệp thành phố Hồ Chí Minh ngày 17 tháng 10 năm 2021

Thành phần Hội đồng đánh giá luận văn thạc sĩ gồm:

1. PGS.TS. Huỳnh Trung Hiếu ...........................- Chủ tịch Hội đồng

2. TS. Lê Thành Sách..........................................- Phản biện 1

3. TS. Đặng Thị Phúc..........................................- Phản biện 2

4. TS. Trịnh Tấn Đạt ...........................................- Ủy viên

5. TS. Lê Nhật Duy .............................................- Thư ký

(Ghi rõ họ, tên, học hàm, học vị của Hội đồng chấm bảo vệ luận văn thạc sĩ)

CHỦ TỊCH HỘI ĐỒNG TRƯỞNG KHOA

CÔNG NGHỆ THÔNG TIN

NHIỆM VỤ LUẬN VĂN THẠC SĨ

Họ tên học viên: Võ Hoàng Nhân MSHV: 17112911

Ngày, tháng, năm sinh: 10/4/1993 Nơi sinh: Sóc Trăng

Chuyên ngành: Khoa học máy tính Mã chuyên ngành: 60480101

I. TÊN ĐỀ TÀI:

Nghiên cứu ứng dụng phương pháp SVM vào phân nhóm học sinh có khả năng cao

vào học tại trường Đại học Kiên Giang

NHIỆM VỤ VÀ NỘI DUNG:

- Nghiên cứu các phương pháp phân nhóm dữ liệu.

- Tiền xử lý dữ thu thập được.

- Xây dựng ứng dụng phân nhóm dữ liệu dựa vào thuậ toán SVM

- Phân tích kết quả và đưa ra hướng phát triển.

II. NGÀY GIAO NHIỆM VỤ: 06/09/2019

III. NGÀY HOÀN THÀNH NHIỆM VỤ: 17/10/2021

IV. NGƯỜI HƯỚNG DẪN KHOA HỌC: TS. Trương Khắc Tùng

Tp. Hồ Chí Minh, ngày … tháng năm 2021

NGƯỜI HƯỚNG DẪN

TS. Trương Khắc Tùng

CHỦ NHIỆM BỘ MÔN ĐÀO TẠO

TRƯỞNG KHOA CÔNG NGHỆ THÔNG TIN

BỘ CÔNG THƯƠNG

TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP

THÀNH PHỐ HỒ CHÍ MINH

CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM

Độc lập - Tự do - Hạnh phúc

i

LỜI CẢM ƠN

Để hoàn thành được bài luận văn thạc sĩ này, tôi xin bày tỏ sự cảm kích đặc biệt tới

cố vấn của tôi, Tiến sĩ Trương Khắc Tùng - Người đã định hướng, trực tiếp dẫn dắt

và cố vấn cho tôi trong suốt thời gian thực hiện đề tài nghiên cứu khoa học. Tôi xin

gửi lời cảm ơn đến thầy bằng tất cả tấm lòng và sự biết ơn của mình.

Tôi cũng xin gửi lời cảm ơn chân thành đến thầy Lê Nhật Duy – Phó khoa Công nghệ

thông tin đã hướng dẫn và giúp đỡ các biểu mẫu và quy trình hoàn thành đề tài luận

văn từ khi bắt đầu đăng ký đề cương đến khi bảo vệ luận văn.

Tôi cũng xin gửi lời cảm ơn chân thành đến thầy Lê Ngọc Sơn – Trưởng phòng Quản

lý Sau đại học và tất cả Thầy, Cô ở đây đã giúp đỡ tôi về các thủ tục cần thiết để hoàn

thành luận văn.

Sau cùng, tôi xin tỏ lòng biết ơn đến Trường Đại học Kiên Giang – Cơ quan nơi tôi

công tác, đã tạo điều kiện về thời gian, công việc để tôi có thể hoàn thành luận văn

thạc sĩ.

Xin chân thành cảm ơn tất cả mọi người!

ii

TÓM TẮT LUẬN VĂN THẠC SĨ

Việc tuyển sinh ở các trường Đại học, Cao đẳng, trung cấp chuyên nghiệp trong thời

gian gần đây là vấn đề được Lãnh đạo trường đặc biệt quan tâm. Các thay đổi quy

định của Bộ giáo dục cũng ảnh hưởng rất nhiều đến hiệu quả tuyển sinh ở các trường.

Bên cạnh đó số lượng các trường Đại học, Cao đẳng, trung cấp chuyên nghiệp được

thành lập ngày càng nhiều vì vậy quá trình tuyển sinh cũng gặp không ít khó khăn,

có rất nhiều trường do không tuyển sinh được đã giải tán hoặc sáp nhập vào các

trường lớn để duy trì hoạt động. Để đối mặt với thực tại trên ở mỗi trường luôn lập

các kế hoạch, chiến lược mới, có tính đột phá để hoàn thành chỉ tiêu của Bộ giáo dục

giao hàng năm và trường Đại học Kiên Giang là một trong số đó.

Trường Đại học Kiên Giang được thành lập theo Quyết định số 758/QĐ/TTg ngày

21/05/2014 của Thủ tướng Chính Phủ trên cơ sở Phân hiệu của Trường Đại Học Nha

Trang tại Kiên Giang. Hiện tại trường có khoảng 5000 Sinh viên theo học, hàng năm

trường được Bộ giáo dục và đào tạo giao chỉ tiêu Tuyển sinh khoảng 1000 Sinh viên.

Do trường mới thành lập nên quá trình Tuyển sinh cũng gặp rất nhiều khó khăn, đã

có nhiều phương án được đưa ra nhưng nhìn chung vẫn chưa được tối ưu.

Vì vậy trong đề tài này chúng tôi đề xuất một phương pháp giúp nhà Trường có cái

nhìn tổng quát về tình hình Tuyển sinh bằng cách phân nhóm học sinh có khả năng

cao vào học tập tại trường Đại học Kiên Giang. Để thực hiện việc này chúng tôi sử

dụng thuật toán Support Vector Machine (SVM) được cài đặt trên ngôn ngữ Python

3.6 và một số thư viện hỗ trợ khác.

iii

ABSTRACT

Student enrollment for universities, colleges, and professional secondary schools was

an issue that the school administrator pay more attention at the moment. Beside, the

enrollment regulations of the Ministry of Education and Training had changed every

year that also significantly affect on enrollment efficiency at schools. In addition, the

number of universities have been established more and more. Therefore, the

enrollment process was also fronting many difficulties. Many schools were not enroll

students that have separated or merged into large schools to maintain operations. To

face the reality situation, Kien Giang university was one of the universities which

always designs breakthrough plans and strategies to fulfill the annual target assigned

by the Ministry of Education and Training.

Kien Giang University was established under Decision No. 758/QD/TTg by the

Prime Minister dated May 21, 2014. Currently, Kien Giang University has about 5000

students. This university is assigned the target of Enrollment about 1000 students by

the Ministry of Education and Training every year. Because Kien Giang University

has been established for 7 years ago, the admission process also faced many

difficulties. Although the administrators tried to find many options, the results of the

enrollment for their university were not satisfactory.

Hence, in this current study, researcher suggested a method to contribute Kien Giang

University have an overview of the enrollment situation by grouping students with

high possibility to learn at Kien Giang University. Researcher used the Support

Vector Machine (SVM) algorithm installed on Python 3.6 language and some other

support archives.

iv

LỜI CAM ĐOAN

Tôi xin cam đoan đây là công trình nghiên cứu của bản thân tôi. Các kết quả nghiên

cứu và các kết luận trong luận văn là trung thực, không sao chép từ bất kỳ một nguồn

nào và dưới bất kỳ hình thức nào. Việc tham khảo các nguồn tài liệu (nếu có) đã được

thực hiện trích dẫn và ghi nguồn tài liệu tham khảo đúng quy định.

Học viên

Võ Hoàng Nhân

v

MỤC LỤC

LỜI CẢM ƠN ............................................................................................................. i

TÓM TẮT LUẬN VĂN THẠC SĨ............................................................................ ii

ABSTRACT.............................................................................................................. iii

LỜI CAM ĐOAN ..................................................................................................... iv

MỤC LỤC...................................................................................................................v

DANH MỤC HÌNH ẢNH ....................................................................................... vii

DANH MỤC BẢNG BIỂU .................................................................................... viii

DANH MỤC TỪ VIẾT TẮT.................................................................................... ix

MỞ ĐẦU.....................................................................................................................1

1. Đặt vấn đề ...............................................................................................................1

2. Mục tiêu nghiên cứu................................................................................................2

3. Đối tượng và phạm vi nghiên cứu...........................................................................2

4. Cách tiếp cận và phương pháp nghiên cứu .............................................................3

5. Ý nghĩa thực tiễn của đề tài.....................................................................................3

CHƯƠNG 1 TỔNG QUAN VỀ LĨNH VỰC NGHIÊN CỨU...............................4

CHƯƠNG 2 CƠ SỞ LÝ THUYẾT........................................................................6

Phân loại các thuật toán Machine learning...................................................6

2.1.1 Phân loại dựa trên phương thức học .....................................................6

2.1.2 Phân loại dựa trên chức năng................................................................7

Các thuật toán dùng để phân nhóm dữ liệu..................................................8

2.2.1 Support Vector Machine (SVM)...........................................................8

2.2.2 Máy học Naïve bayes..........................................................................14

2.2.3 Máy học cây quyết định......................................................................17

Mạng Nơ-ron ..............................................................................................22

2.3.1 Perceptrons..........................................................................................22

2.3.2 Kiến trúc mạng NN.............................................................................26

2.3.3 Lan truyền tiến ....................................................................................28

2.3.4 Học với mạng NN...............................................................................29

2.3.5 Lan truyền ngược và đạo hàm.............................................................29

2.3.6 Kết luận...............................................................................................31

Thuật toán Principal Component Analysis.................................................32

Tải ngay đi em, còn do dự, trời tối mất!