Siêu thị PDFTải ngay đi em, trời tối mất

Thư viện tri thức trực tuyến

Kho tài liệu với 50,000+ tài liệu học thuật

© 2023 Siêu thị PDF - Kho tài liệu học thuật hàng đầu Việt Nam

T
PREMIUM
Số trang
86
Kích thước
4.8 MB
Định dạng
PDF
Lượt xem
1445

Dự đoán hiệu quả làm việc của ứng viên sử dụng kỹ thuật khai phá dữ liệu

Nội dung xem thử

Mô tả chi tiết

1

BỘ GIÁO DỤC VÀ ĐÀO TẠO

TRƯỜNG ĐẠI HỌC MỞ THÀNH PHỐ HỒ CHÍ MINH

--------∞0∞--------

TRẦN THỊ THU

DỰ ĐOÁN HIỆU QUẢ LÀM VIỆC CỦA ỨNG VIÊN

SỬ DỤNG KỸ THUẬT KHAI PHÁ DỮ LIỆU

LUẬN VĂN THẠC SĨ

KHOA HỌC MÁY TÍNH

TP. HỒ CHÍ MINH, NĂM 2022

2

BỘ GIÁO DỤC VÀ ĐÀO TẠO

TRƯỜNG ĐẠI HỌC MỞ THÀNH PHỐ HỒ CHÍ MINH

--------∞0∞--------

TRẦN THỊ THU

DỰ ĐOÁN HIỆU QUẢ LÀM VIỆC CỦA ỨNG VIÊN

SỬ DỤNG KỸ THUẬT KHAI PHÁ DỮ LIỆU

Chuyên ngành: Khoa học máy tính

Mã số chuyên ngành: 8 48 01 01

LUẬN VĂN THẠC SĨ

KHOA HỌC MÁY TÍNH

Giảng viên hướng dẫn: TS. NGUYỄN TIẾN ĐẠT

TP. HỒ CHÍ MINH, NĂM 2022

TRƯỜNG ĐẠI HỌC MỞ

THÀNH PHỐ HỒ CHÍ MINH

KHOA ĐÀO TẠO SAU ĐẠI HỌC

CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM

Độc lập – Tự do – Hạnh phúc

GIẤY XÁC NHẬN

Tôi tên là: TRẦN THỊ THU

Ngày sinh: 20/11/1984 Nơi sinh: Bình Định

Chuyên ngành: Khoa học máy tính

Mã học viên: 1884801010016

Tôi đồng ý cung cấp toàn văn thông tin luận văn tốt nghiệp hợp lệ về bản quyền cho

Thư viện trường đại học Mở Thành phố Hồ Chí Minh. Thư viện trường đại học Mở

Thành phố Hồ Chí Minh sẽ kết nối toàn văn thông tin luận văn tốt nghiệp vào hệ

thống thông tin khoa học của Sở Khoa học và Công nghệ Thành phố Hồ Chí Minh.

Ký tên

Trần Thị Thu

CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM

Độc lập – Tự do – Hạnh phúc

Ý KIẾN CHO PHÉP BẢO VỆ LUẬN VĂN THẠC SĨ

CỦA GIẢNG VIÊN HƯỚNG DẪN

Giảng viên hướng dẫn: TS. Nguyễn Tiến Đạt

Học viên thực hiện: Trần Thị Thu Lớp: MCOM018B

Ngày sinh: 20/11/1984 Nơi sinh: Bình Định

Tên đề tài: Dự đoán hiệu quả làm việc của ứng viên sử dụng kỹ thuật khai phá dữ liệu

A-Nhận xét học viên trong quá trình thực hiện luận văn

 So với kế hoạch do GVHD và học viên đề ra: thiếu 1 bài hội thảo với nội dung liên quan đến

ứng dụng hỗ trợ dự đoán, hoàn thành một ứng dụng hỗ trợ dự đoán hiệu quả làm việc của

các ứng viên. Yêu cầu thu thập 1 (một) bộ dữ liệu chuyên ngành và của Việt Nam để thực

nghiệm: chưa đầy đủ.

B-Nhận xét luận văn

 Cần tuân thủ theo định dạng từ Khoa Đào Tạo Sau ĐH (nếu có) về hình thức luận văn cũng

như chỉnh sửa theo đề nghị của GVHD và các Thầy Cô trong Hội Đồng. Kiểm tra để tránh

lỗi chính tả, các đoạn văn bị ngắt khi sang trang (tình trạng orphan và widow).

 Cần nhấn mạnh đến lĩnh vực mà luận văn đang đề cập: Khai Phá Dữ Liệu, tránh lầm lẫn với

Máy Học. Tác giả nên trình bày rõ lý do sử dụng 3 thuật toán trong luận văn mà không dùng

các thuật toán khác. Bộ dữ liệu thu thập và sử dụng: cần nói rõ nguồn thu thập, các vùng

thông tin có thực sự cần thiết (qua tư vấn từ các chuyên gia), ý nghĩa các vùng thông tin,

quá trình tiền xử lý,…

 Với các vùng thông tin được rời rạc hóa: vì sao chọn sơ dồ rời rạc hóa này? giải thích?? liệu

sơ đồ (scheme) này có tốt nhất không? Câu hỏi cũng tương tự cho các vùng mà tác giả thực

hiện rời rạc hóa trong bộ dữ liệu.

 Cần tìm hiểu để có thể giải thích vì sao nhóm B2 có kết quả tệ hơn so với các nhóm khác

trong cả 3 thuật toán, cũng cần có những mô tả, giải thích, dự báo, giả thiết,… sau khi thực

hiện thử nghiệm, không nên chỉ trình bày kết quả chỉ là số liệu.

Ý kiến của giáo viên hướng dẫn về việc cho phép học viên được bảo vệ luận văn trước Hội

đồng: Đồng ý cho học viên Trần Thị Thu được trình bày nội dung luận văn trước hội đồng.

Thành phố Hồ Chí Minh, ngày … tháng … năm 2022

Người nhận xét

TS. Nguyễn Tiến Đạt

i

LỜI CAM ĐOAN

Tôi cam đoan rằng luận văn “Dự đoán hiệu quả làm việc của ứng viên sử

dụng kỹ thuật khai phá dữ liệu” là bài nghiên cứu của chính tôi.

Ngoại trừ những tài liệu tham khảo được trích dẫn trong luận văn này, tôi

cam đoan rằng toàn phần hay những phần nhỏ của luận văn này chưa từng được

công bố hoặc được sử dụng để nhận bằng cấp ở những nơi khác.

Không có sản phẩm/nghiên cứu nào của người khác được sử dụng trong

luận văn này mà không được trích dẫn theo đúng quy định.

Luận văn này chưa bao giờ được nộp để nhận bất kỳ bằng cấp nào tại các

trường đại học hoặc cơ sở đào tạo khác.

Thành phố Hồ Chí Minh, năm 2022

Trần Thị Thu

ii

LỜI CÁM ƠN

Trong thời gian học tập, nghiên cứu để hoàn thiện luận văn, tôi đã nhận

được sự hướng dẫn, giúp đỡ rất tận tình của quý thầy cô, bạn bè và đồng nghiệp.

Tôi xin gửi lời cảm ơn sâu sắc đến TS. Nguyễn Tiến Đạt, thầy đã rất nhiệt

tình hướng dẫn và hỗ trợ tôi tận tình trong suốt thời gian nghiên cứu và thực

hiện luận văn. Tôi đã rất may mắn khi được thầy chấp nhận hướng dẫn, một lần

nữa xin gửi lời cảm ơn sâu sắc đến thầy, TS. Nguyễn Tiến Đạt.

Ngoài ra tôi xin cảm ơn quý thầy cô lãnh đạo, giảng viên, chuyên viên,

thư viện trường Đại học Mở TP. Hồ Chí Minh đã cung cấp những kiến thức, tài

liệu quý báu cũng như hỗ trợ cho tôi trong suốt thời gian học tập tại trường. Tôi

xin chân thành cảm ơn đến các anh chị trong bộ phận nhân sự thuộc Công ty

TNHH Hitachi Vantara Việt Nam đã hướng dẫn kiến thức về quản trị nguồn

nhân lực, nghiệp vụ về tuyển dụng nhân sự, đồng thời tạo điều kiện để tôi thực

hiện bộ dữ liệu về kết quả đánh giá hiệu quả làm việc của nhân viên.

Cuối cùng tôi xin gửi lời cảm ơn đến Ban lãnh đạo Trường Đại học Luật

Hà Nội và những người thân yêu trong gia đình đã luôn tạo điều kiện thuận lợi

nhất, hỗ trợ và động viên để tôi hoàn thành luận văn cũng như chương trình học

tại trường.

iii

TÓM TẮT

Trong công tác tuyển dụng nhân sự, nhà quản lý cần dự đoán hiệu suất

làm việc của ứng viên trước khi tuyển dụng hoặc dự đoán kết quả làm việc của

nhân viên để có những quy hoạch nhân sự phù hợp nhằm giữ chân nhân tài và

phân công công việc phù hợp với định hướng phát triển của công ty. Trong bài

nghiên cứu “Dự đoán hiệu quả làm việc của ứng viên sử dụng kỹ thuật khai phá

dữ liệu”, chúng tôi đã sử dụng các kỹ thuật kết hợp khai phá dữ liệu (với thuật

toán Naïve Bayes, Random Forest và Support Vector Machine) để thực nghiệm

dựa trên một dữ liệu lịch sử bao gồm các thông tin về hiệu suất làm việc, thông

tin cá nhân được thu thập trước đó để đánh giá mô hình dự đoán. Kết quả thực

nghiệm cho thấy mô hình đề xuất với thuật toán phân lớp Random Forest là cho

kết quả tối ưu nhất. Chúng tôi cũng so sánh các thuật toán nhằm lựa chọn mô

hình dự đoán hầu lại kết quả chính xác cao hơn. Công trình này đóng góp một

bộ dữ liệu bao gồm các thuộc tính ảnh hưởng đến đánh giá hiệu suất ứng viên,

bao gồm các thuộc tính “kỹ năng” đã được đề xuất trong các nghiên cứu trước

đây và bổ sung thêm các thuộc tính về “tính cách” của ứng viên.

iv

ABSTRACT

In recruiting personnel, managers need to predict candidate's performance

before hiring or predict the employee's performance to have suitable personnel

plans to retain talents and assign jobs in accordance with the company's

development orientation. In the research paper "Predicting candidate

performance using data mining techniques", we applied techniques that combine

with data mining (with Naïve Bayes, Random Forest and Support Vector

Machine algorithm) to experiment based on a historical data including

performance information and personal information previously collected to

evaluate the predictive model. Experimental results show that the proposed

model with the Random Forest layering algorithm gives the most optimal result.

We also compared these algorithms to select a predictive model for more

accurate results. This work contributes a dataset that includes attributes that

influence candidate performance assessments, includes "skills" attributes that

have been suggested in previous studies, and adds attributes of candidate's

"personality".

Tải ngay đi em, còn do dự, trời tối mất!