Thư viện tri thức trực tuyến
Kho tài liệu với 50,000+ tài liệu học thuật
© 2023 Siêu thị PDF - Kho tài liệu học thuật hàng đầu Việt Nam

Ứng dụng khai phá dữ liệu để định hướng nghề nghiệp cho học sinh trường thpt trần phú, tỉnh quảng nam
Nội dung xem thử
Mô tả chi tiết
ĐẠI HỌC ĐÀ NẴNG
TRƢỜNG ĐẠI HỌC SƢ PHẠM ĐÀ NẴNG
-------------------------------
TRẦN VĂN TÂM
ỨNG DỤNG KHAI PHÁ DỮ LIỆU
ĐỂ ĐỊNH HƢỚNG NGHỀ NGHIỆP CHO HỌC SINH
TRƢỜNG THPT TRẦN PHÚ, TỈNH QUẢNG NAM
LUẬN VĂN THẠC SĨ
NGÀNH HỆ THỐNG THÔNG TIN
Đà Nẵng, năm 2023
ĐẠI HỌC ĐÀ NẴNG
TRƢỜNG ĐẠI HỌC SƢ PHẠM ĐÀ NẴNG
-------------------------------
TRẦN VĂN TÂM
ỨNG DỤNG KHAI PHÁ DỮ LIỆU
ĐỂ ĐỊNH HƢỚNG NGHỀ NGHIỆP CHO HỌC SINH
TRƢỜNG THPT TRẦN PHÚ, TỈNH QUẢNG NAM
Ngành: Hệ thống thông tin
Mã số: 84.80.104
NGƢỜI HƢỚNG DẪN KHOA HỌC
TS. Nguyễn Trần Quốc Vinh
Đà Nẵng, năm 2023
i
Lời cam đoan
Tôi cam đoan rằng đề tài luận văn: “Ứng dụng khai phá dữ liệu để định hƣớng
nghề nghiệp cho học sinh trƣờng THPT Trần Phú, tỉnh Quảng Nam” là bài nghiên cứu
của chính tôi.
Ngoại trừ những tài liệu tham khảo đƣợc trích dẫn trong luận văn này, tôi cam
đoan rằng toàn phần hay những phần nhỏ của luận văn này chƣa từng đƣợc công bố
hay đƣợc sử dụng để nhận bằng cấp ở những nơi khác.
Không có sản phẩm nghiên cứu nào của ngƣời khác đƣợc sử dụng trong luận
văn này mà không đƣợc trích dẫn theo đúng quy định.
Quảng Nam, tháng 01 năm 2023
Tác giả luận văn
Trần Văn Tâm
ii
Lời cảm ơn
Đề tài luận văn “Ứng dụng khai phá dữ liệu để định hƣớng nghề nghiệp cho
học sinh trƣờng THPT Trần Phú, tỉnh Quảng Nam” đƣợc nghiên cứu trên địa bàn
huyện Hiệp Đức với số lƣợng 911 học sinh đã và đang học tại trƣờng THPT Trần Phú.
Đƣợc sự hƣớng dẫn và giúp đỡ tận tình của Cán bộ hƣớng dẫn, cùng tất cả thầy cô giáo
trong khoa Tin học – Đại học sƣ phạm Đà Nẵng.
Trƣớc tiên, tôi xin bày tỏ lòng biết ơn và kính trọng sâu sắc nhất đến Thầy giáo -
TS. Nguyễn Trần Quốc Vinh, ngƣời đã nhiệt tình hƣớng dẫn, chỉ bảo và cho những ý kiến
quý báu trong quá trình tôi hoàn thành khóa luận.
Tôi bày tỏ lòng biết ơn chân thành đến quý thầy cô giáo Khoa Tin học, Khoa đào
tạo sau đại học và các phòng ban liên quan trong Đại học sƣ phạm Đà Nẵng đã tạo điều
kiện thuận lợi, giúp đỡ tôi trong quá trình học tập và nghiên cứu.
Tôi xin cảm ơn lãnh đạo trƣờng THPT Trần Phú đã tạo điều kiện thuận lợi giúp
tôi thu thập các số liệu liên quan để phục vụ viết khóa luận.
Cuối cùng, tôi xin gửi lời cảm ơn tới gia đình, bạn bè, đồng nghiệp đã động
viên giúp đỡ chia sẻ công việc để tôi có thời gian học tập và hoàn thành luận văn này.
Quảng Nam, tháng 01 năm 2023
Tác giả
Trần Văn Tâm
iii
Tóm tắt
ỨNG DỤNG KHAI PHÁ DỮ LIỆU ĐỂ ĐỊNH HƢỚNG NGHỀ NGHIỆP CHO
HỌC SINH TRƢỜNG THPT TRẦN PHÚ, TỈNH QUẢNG NAM.
Ngành: Hệ thống thông tin
Họ và tên học viên: Trần Văn Tâm
Ngƣời hƣớng dẫn khoa học: TS. Nguyễn Trần Quốc Vinh
Cơ sở đào tạo: Trƣờng Đại học Sƣ phạm – Đại học Đà Nẵng
Tóm tắt: Định hƣớng nghề nghiệp là việc cung cấp thông tin, kinh nghiệm làm việc để một ngƣời
nào đó có thể lựa chọn một ngành nghề nào đó sao cho phù hợp kỹ năng, sở trƣờng của bản thân và phù
hợp với nhu cầu thị trƣờng lao động. Việc định hƣớng nghề nghiệp quan trọng với tất cả mọi ngƣời, trong
đó quan trọng nhất là đối với các em học sinh đang ở độ tuổi học THPT, bởi đây là độ tuổi rất trẻ, có đóng
góp to lớn cho sự phát triển của đất nƣớc trong tƣơng lai. Nhận thức đƣợc tầm quan trọng của vấn đề này,
luận văn đã tiến hành thu thập thông tin về đăng ký tuyển sinh tại trƣờng THPT Trần Phú, tỉnh Quảng Nam
trong 5 năm từ 2017 đến 2021, từ thông tin thu thập đƣợc, tác giả đã xây dựng CSDL và tiến hành sử dụng
kỹ thuật phân lớp bằng cây quyết định và luật kết hợp để khai phá dữ liệu.
Những kết quả chính: Luận văn đã sử dụng thuật toán C4.5 cho ra mô hình phân lớp là một tập
luật đơn giản, có độ chính xác khá cao, ứng dụng các kỹ thuật phân lớp và công cụ hỗ trợ khai phá dữ liệu
– BIDS để xây dựng mô hình dự đoán khả năng hạnh phúc của học sinh khi chọn ngành nghề đăng ký
tuyển sinh vào các trƣờng Đại học. Luận văn đã so sánh kết quả của hai kỹ thuật phân lớp là cây quyết định
và luật kết hợp để lựa chọn kỹ thuật cho kết quả chính xác nhất. Từ đó xây dựng chƣơng trình dự đoán khả
năng thành công, hạnh phúc khi học sinh chọn ngành nghề dựa trên các thông tin đầu vào cần thiết.
Về ý nghĩa khoa học và thực tiễn: Luận văn đã tiến hành thu thập thông tin từ 911 học sinh đã
trúng tuyển vào các trƣờng Đại học trong 5 năm học, sau đó thực hiện khai phá dữ liệu và đối chứng với
kết quả khảo sát đƣợc, kết quả đối chứng khá cao, độ chính xác 67%. Về thực tiễn, luận văn đã xây dựng
ứng dụng trên nền web có thể triển khai cho học sinh thực hiện việc tra cứu khám phá về đăng ký chọn
ngành nghề sẽ theo học và dự báo khả năng thành công, hạnh phúc với lựa chọn đó hay không, từ đó học
sinh có thể điều chỉnh nguyện vọng theo mong muốn.
Hƣớng nghiên cứu: Ứng dụng của luận văn có thể đƣợc triển khai rộng rãi cho nhiều trƣờng THPT
tại tỉnh Quảng Nam, kết quả của luận văn giúp học sinh có định hƣớng sớm về việc lựa chọn ngành nghề
phù hợp với bản thân, đồng thời giúp nhà trƣờng có cơ sở để triển khai công tác giáo dục, định hƣớng nghề
nghiệp hiệu quả trong thời gian tới.
Từ khóa: Định hƣớng nghề nghiệp, tƣ vấn hƣớng nghiệp, cơ sở dữ liệu, dự báo, hƣớng nghiệp.
Xác nhận của giáo viên hƣớng dẫn Ngƣời thực hiện đề tài
TS. Nguyễn Trần Quốc Vinh Trần Văn Tâm
iv
Abstract
THE DATA MINING APPLICATION TO GUIDE CAREERS FOR STUDENTS
AT TRAN PHU HIGH SCHOOL
Major: Information Systems
Full name of Master Student: Tran Van Tam
Supervisors: Nguyen Tran Quoc Vinh, PhD
Training institution: Danang University of Science and Education
Abstract:
In Summary:Careers guidance is to provide information, work experience so that someone
can choose a career that suitable for their skills, forte and appropriate to the needs of the labour
market. Careers guidance is significant to everyone, especially to high school students because they
are at a very young age and will be able to make a substantial contribution to the country’s
development in the future. Realizing how important this is, I (the writer) collected the information of
entrance exams or admission to universities at Tran Phu High School, Quang Nam Province within the
last five years from 2017 to 2021 for my thesis. On the basis of the collected information, the writer
built a database and used the technique of Classification by Decision Tree and Association Rules for
data mining.
Main results: in the thesis, C4.5 agorithm was used to produce a classification model – series
of simple rules, which are of high degree of precision, applying classification techniques and data
mining aids – IBDS to build a model predicting students’ possibility of future happiness when they
decide to choose an industry to apply for to be admitted to universities. The thesis compared the
results of the two classification techniques – Decision Tree and Association Rules so as to select the
technique producing the most precise result. And the writer built a programme predicting students’
possibilities of success, happiness when they decide on an a career to pursue, based on the necessary
input information.
In respect of science and practice: the thesis carried out gathering information from 911
students admitted to universities in the last five years. After that, it implemented data mining, and
compared survey results with results at the pretty high degree of precision – 67%. In the practical
aspect, the thesis built applications on the basis of web, which might be possible to be deployed to
students performing a search of applying for an industry to study and predicting whether they will be
likely to be successful, happy with their choice or not. Thanks to this, students might alter their choice
properly.
Reserach direction: The thesis’ application is possible to be deployed widely to a lot of high
schools in Quang Nam. The thesis’ results help students have early orientation towards choosing a
career suitable for themselves, simultaneously also help schools have a good base for deploying
educational work, jobs guidanceefficiently in the coming time.
Key words: Careers/jobs guidance, job counselling, database, predict
Supervior’s confirmation Student
Nguyen Tran Quoc Vinh, PhD Tran Van Tam
v
Lời cam đoan .............................................................................................................i
Lời cảm ơn ............................................................................................................... ii
Tóm tắt .................................................................................................................... iii
Abstract ....................................................................................................................iv
Danh mục các từ viết tắt. ...................................................................................... viii
Danh mục các bảng..................................................................................................ix
Danh mục các hình vẽ, đồ thị....................................................................................x
MỞ ĐẦU...................................................................................................................1
1. Lý do chọn đề tài...................................................................................................1
2. Mục tiêu nghiên cứu. ............................................................................................2
2.1. Mục tiêu. .................................................................................................2
2.2. Nhiệm vụ.................................................................................................2
3. Đối tƣợng nghiên cứu. ..........................................................................................2
3.1. Đối tƣợng nghiên cứu. ............................................................................2
3.2. Phạm vi nghiên cứu.................................................................................2
4. Phƣơng pháp nghiên cứu. .....................................................................................3
4.1. Nghiên cứu lý thuyết...............................................................................3
4.2. Nghiên cứu thực nghiệm.........................................................................3
5. Ý nghĩa khoa học và thực tiễn của đề tài. .............................................................3
5.1. Về mặt khoa học. ....................................................................................3
5.2. Về mặt thực tiễn ...................................................................................3
6. Kết quả dự kiến. ....................................................................................................3
6.1. Lý thuyết. ................................................................................................3
6.2. Thực tiễn. ................................................................................................3
7. Cấu trúc của luận văn............................................................................................4
CHƢƠNG 1: GIỚI THIỆU TỔNG QUAN..............................................................5
1.1 Khai phá dữ liệu. .................................................................................................5
1.1.1 Khái niệm khai phá dữ liệu.................................................................5
1.1.2 Tại sao lại cần khai phá dữ liệu. .........................................................5
1.1.3 Quá trình khai phá dữ liệu. .................................................................6
1.1.4 Các tác vụ khai phá dữ liệu (data mining tasks/functions).................7
1.1.4.1 Một số tác vụ khai phá dữ liệu.........................................................7
1.1.4.2 Năm thành tố cơ bản để đặc tả một tác vụ khai phá dữ liệu. ...........7
1.2 Khái quát về các kỹ thuật khai phá dữ liệu. ........................................................7
1.2.1 Khai thác tập phổ biến và luật kết hợp. ..............................................7
1.2.2 Phân lớp (Classification). ...................................................................8
1.3 Kỹ thuật khai phá dữ liệu sử dụng cây quyết định..............................................8
1.3.1 Cây quyết định....................................................................................8
1.3.1.1 Giới thiệu cây quyết định.................................................................8