Thư viện tri thức trực tuyến
Kho tài liệu với 50,000+ tài liệu học thuật
© 2023 Siêu thị PDF - Kho tài liệu học thuật hàng đầu Việt Nam
Dự đoán hiệu quả làm việc của ứng viên sử dụng kỹ thuật khai phá dữ liệu
Nội dung xem thử
Mô tả chi tiết
1
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC MỞ THÀNH PHỐ HỒ CHÍ MINH
--------∞0∞--------
TRẦN THỊ THU
DỰ ĐOÁN HIỆU QUẢ LÀM VIỆC CỦA ỨNG VIÊN
SỬ DỤNG KỸ THUẬT KHAI PHÁ DỮ LIỆU
LUẬN VĂN THẠC SĨ
KHOA HỌC MÁY TÍNH
TP. HỒ CHÍ MINH, NĂM 2022
2
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC MỞ THÀNH PHỐ HỒ CHÍ MINH
--------∞0∞--------
TRẦN THỊ THU
DỰ ĐOÁN HIỆU QUẢ LÀM VIỆC CỦA ỨNG VIÊN
SỬ DỤNG KỸ THUẬT KHAI PHÁ DỮ LIỆU
Chuyên ngành: Khoa học máy tính
Mã số chuyên ngành: 8 48 01 01
LUẬN VĂN THẠC SĨ
KHOA HỌC MÁY TÍNH
Giảng viên hướng dẫn: TS. NGUYỄN TIẾN ĐẠT
TP. HỒ CHÍ MINH, NĂM 2022
TRƯỜNG ĐẠI HỌC MỞ
THÀNH PHỐ HỒ CHÍ MINH
KHOA ĐÀO TẠO SAU ĐẠI HỌC
CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM
Độc lập – Tự do – Hạnh phúc
GIẤY XÁC NHẬN
Tôi tên là: TRẦN THỊ THU
Ngày sinh: 20/11/1984 Nơi sinh: Bình Định
Chuyên ngành: Khoa học máy tính
Mã học viên: 1884801010016
Tôi đồng ý cung cấp toàn văn thông tin luận văn tốt nghiệp hợp lệ về bản quyền cho
Thư viện trường đại học Mở Thành phố Hồ Chí Minh. Thư viện trường đại học Mở
Thành phố Hồ Chí Minh sẽ kết nối toàn văn thông tin luận văn tốt nghiệp vào hệ
thống thông tin khoa học của Sở Khoa học và Công nghệ Thành phố Hồ Chí Minh.
Ký tên
Trần Thị Thu
CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM
Độc lập – Tự do – Hạnh phúc
Ý KIẾN CHO PHÉP BẢO VỆ LUẬN VĂN THẠC SĨ
CỦA GIẢNG VIÊN HƯỚNG DẪN
Giảng viên hướng dẫn: TS. Nguyễn Tiến Đạt
Học viên thực hiện: Trần Thị Thu Lớp: MCOM018B
Ngày sinh: 20/11/1984 Nơi sinh: Bình Định
Tên đề tài: Dự đoán hiệu quả làm việc của ứng viên sử dụng kỹ thuật khai phá dữ liệu
A-Nhận xét học viên trong quá trình thực hiện luận văn
So với kế hoạch do GVHD và học viên đề ra: thiếu 1 bài hội thảo với nội dung liên quan đến
ứng dụng hỗ trợ dự đoán, hoàn thành một ứng dụng hỗ trợ dự đoán hiệu quả làm việc của
các ứng viên. Yêu cầu thu thập 1 (một) bộ dữ liệu chuyên ngành và của Việt Nam để thực
nghiệm: chưa đầy đủ.
B-Nhận xét luận văn
Cần tuân thủ theo định dạng từ Khoa Đào Tạo Sau ĐH (nếu có) về hình thức luận văn cũng
như chỉnh sửa theo đề nghị của GVHD và các Thầy Cô trong Hội Đồng. Kiểm tra để tránh
lỗi chính tả, các đoạn văn bị ngắt khi sang trang (tình trạng orphan và widow).
Cần nhấn mạnh đến lĩnh vực mà luận văn đang đề cập: Khai Phá Dữ Liệu, tránh lầm lẫn với
Máy Học. Tác giả nên trình bày rõ lý do sử dụng 3 thuật toán trong luận văn mà không dùng
các thuật toán khác. Bộ dữ liệu thu thập và sử dụng: cần nói rõ nguồn thu thập, các vùng
thông tin có thực sự cần thiết (qua tư vấn từ các chuyên gia), ý nghĩa các vùng thông tin,
quá trình tiền xử lý,…
Với các vùng thông tin được rời rạc hóa: vì sao chọn sơ dồ rời rạc hóa này? giải thích?? liệu
sơ đồ (scheme) này có tốt nhất không? Câu hỏi cũng tương tự cho các vùng mà tác giả thực
hiện rời rạc hóa trong bộ dữ liệu.
Cần tìm hiểu để có thể giải thích vì sao nhóm B2 có kết quả tệ hơn so với các nhóm khác
trong cả 3 thuật toán, cũng cần có những mô tả, giải thích, dự báo, giả thiết,… sau khi thực
hiện thử nghiệm, không nên chỉ trình bày kết quả chỉ là số liệu.
Ý kiến của giáo viên hướng dẫn về việc cho phép học viên được bảo vệ luận văn trước Hội
đồng: Đồng ý cho học viên Trần Thị Thu được trình bày nội dung luận văn trước hội đồng.
Thành phố Hồ Chí Minh, ngày … tháng … năm 2022
Người nhận xét
TS. Nguyễn Tiến Đạt
i
LỜI CAM ĐOAN
Tôi cam đoan rằng luận văn “Dự đoán hiệu quả làm việc của ứng viên sử
dụng kỹ thuật khai phá dữ liệu” là bài nghiên cứu của chính tôi.
Ngoại trừ những tài liệu tham khảo được trích dẫn trong luận văn này, tôi
cam đoan rằng toàn phần hay những phần nhỏ của luận văn này chưa từng được
công bố hoặc được sử dụng để nhận bằng cấp ở những nơi khác.
Không có sản phẩm/nghiên cứu nào của người khác được sử dụng trong
luận văn này mà không được trích dẫn theo đúng quy định.
Luận văn này chưa bao giờ được nộp để nhận bất kỳ bằng cấp nào tại các
trường đại học hoặc cơ sở đào tạo khác.
Thành phố Hồ Chí Minh, năm 2022
Trần Thị Thu
ii
LỜI CÁM ƠN
Trong thời gian học tập, nghiên cứu để hoàn thiện luận văn, tôi đã nhận
được sự hướng dẫn, giúp đỡ rất tận tình của quý thầy cô, bạn bè và đồng nghiệp.
Tôi xin gửi lời cảm ơn sâu sắc đến TS. Nguyễn Tiến Đạt, thầy đã rất nhiệt
tình hướng dẫn và hỗ trợ tôi tận tình trong suốt thời gian nghiên cứu và thực
hiện luận văn. Tôi đã rất may mắn khi được thầy chấp nhận hướng dẫn, một lần
nữa xin gửi lời cảm ơn sâu sắc đến thầy, TS. Nguyễn Tiến Đạt.
Ngoài ra tôi xin cảm ơn quý thầy cô lãnh đạo, giảng viên, chuyên viên,
thư viện trường Đại học Mở TP. Hồ Chí Minh đã cung cấp những kiến thức, tài
liệu quý báu cũng như hỗ trợ cho tôi trong suốt thời gian học tập tại trường. Tôi
xin chân thành cảm ơn đến các anh chị trong bộ phận nhân sự thuộc Công ty
TNHH Hitachi Vantara Việt Nam đã hướng dẫn kiến thức về quản trị nguồn
nhân lực, nghiệp vụ về tuyển dụng nhân sự, đồng thời tạo điều kiện để tôi thực
hiện bộ dữ liệu về kết quả đánh giá hiệu quả làm việc của nhân viên.
Cuối cùng tôi xin gửi lời cảm ơn đến Ban lãnh đạo Trường Đại học Luật
Hà Nội và những người thân yêu trong gia đình đã luôn tạo điều kiện thuận lợi
nhất, hỗ trợ và động viên để tôi hoàn thành luận văn cũng như chương trình học
tại trường.
iii
TÓM TẮT
Trong công tác tuyển dụng nhân sự, nhà quản lý cần dự đoán hiệu suất
làm việc của ứng viên trước khi tuyển dụng hoặc dự đoán kết quả làm việc của
nhân viên để có những quy hoạch nhân sự phù hợp nhằm giữ chân nhân tài và
phân công công việc phù hợp với định hướng phát triển của công ty. Trong bài
nghiên cứu “Dự đoán hiệu quả làm việc của ứng viên sử dụng kỹ thuật khai phá
dữ liệu”, chúng tôi đã sử dụng các kỹ thuật kết hợp khai phá dữ liệu (với thuật
toán Naïve Bayes, Random Forest và Support Vector Machine) để thực nghiệm
dựa trên một dữ liệu lịch sử bao gồm các thông tin về hiệu suất làm việc, thông
tin cá nhân được thu thập trước đó để đánh giá mô hình dự đoán. Kết quả thực
nghiệm cho thấy mô hình đề xuất với thuật toán phân lớp Random Forest là cho
kết quả tối ưu nhất. Chúng tôi cũng so sánh các thuật toán nhằm lựa chọn mô
hình dự đoán hầu lại kết quả chính xác cao hơn. Công trình này đóng góp một
bộ dữ liệu bao gồm các thuộc tính ảnh hưởng đến đánh giá hiệu suất ứng viên,
bao gồm các thuộc tính “kỹ năng” đã được đề xuất trong các nghiên cứu trước
đây và bổ sung thêm các thuộc tính về “tính cách” của ứng viên.
iv
ABSTRACT
In recruiting personnel, managers need to predict candidate's performance
before hiring or predict the employee's performance to have suitable personnel
plans to retain talents and assign jobs in accordance with the company's
development orientation. In the research paper "Predicting candidate
performance using data mining techniques", we applied techniques that combine
with data mining (with Naïve Bayes, Random Forest and Support Vector
Machine algorithm) to experiment based on a historical data including
performance information and personal information previously collected to
evaluate the predictive model. Experimental results show that the proposed
model with the Random Forest layering algorithm gives the most optimal result.
We also compared these algorithms to select a predictive model for more
accurate results. This work contributes a dataset that includes attributes that
influence candidate performance assessments, includes "skills" attributes that
have been suggested in previous studies, and adds attributes of candidate's
"personality".