Thư viện tri thức trực tuyến
Kho tài liệu với 50,000+ tài liệu học thuật
© 2023 Siêu thị PDF - Kho tài liệu học thuật hàng đầu Việt Nam

Ứng dụng học máy đề phát hiện bất thường trong an ninh mạng
Nội dung xem thử
Mô tả chi tiết
Hội nghị Khoa học trẻ lần 3 năm 2021 (YSC2021) – IUH
Ngày 05-06/8/2021 ISBN: 978-604-920-123-3
© 2021 Trường Đại học Công nghiệp Thành phố Hồ Chí Minh 221
ID: YSC3F.224
ỨNG DỤNG HỌC MÁY ĐỀ PHÁT HIỆN BẤT THƯỜNG TRONG
AN NINH MẠNG
TRỊNH THỊ BẢO BẢO1(*), ĐINH HOÀNG HẢI ĐĂNG1
, PHAN LÊ HOÀNG VIỆT1
, TRẦN NAM BÁ1
,
NGUYỄN THỊ THANH HÒA1
, NGUYỄN VĂN ANH TUẤN1
, NGUYỄN CHÍ KIÊN1
, NGUYỄN
HỮU TÌNH1
1Khoa Công nghệ Thông tin, Trường Đại học Công nghiệp Thành phố Hồ Chí Minh
[email protected], [email protected], [email protected],
[email protected], [email protected], [email protected],
[email protected], [email protected]
Tóm tắt. Các hệ thống máy tính nối mạng Internet ngày nay đang phải đối diện với tấn công mạng ngày
càng tinh vi và có quy mô lớn. Vì vậy các cơ chế phòng vệ cũng cần phải phản ứng nhanh, linh hoạt, và dễ
dàng triển khai trên quy mô lớn. Từ trước đến nay, học máy đã được áp dụng rộng rãi để xây dựng các
chiến lược tấn công và phòng thủ trong an ninh mạng. Phía tấn công sử dụng học máy để vô hiệu hoá các
chiến lược phòng thủ. Phía phòng thủ sử dụng học máy để ngăn ngừa tấn công và giảm thiểu các rủi ro và
tác động đến hệ thống. Trong bài nghiên cứu này, chúng tôi sử dụng mô hình phân lớp nhị phân Random
Forest để học các tấn công và hành vi của phía tấn công trong quá khứ sau đó gán nhãn cho dữ liệu thành
hai lớp bất thường và bình thường. Chúng tôi sử dụng bộ dữ liệu NSL-KDD được tối ưu từ bộ dữ liệu KDD99 để kiểm thử và đánh giá các mô hình học máy. Kết quả khi kiểm thử có sai số thấp, có thể nói hiệu quả
từ các mô hình của chúng tôi đã được tối ưu hơn, hoàn thiện hơn.
Từ khóa. học máy, random forest, an ninh mạng, phát hiện bất thường, tấn công mạng.
USING MACHINE LEARNING TO DETECT ABNORMAL IN CYBER SECURITY
Abstract. Computer systems connected to the Internet today are facing increasingly sophisticated and
large-scale cyberattacks. So defense mechanisms also need to be responsive, flexible, and easy to deploy
on a large scale. Hitherto, machine learning has been widely applied to build offensive and defensive
strategies in cybersecurity. The attackers use machine learning to neutralize defensive strategies. The
defense side uses machine learning to prevent attacks and minimize risks and impacts on the system. In this
research project, we use the Random Forest binary classification model to learn past attacks and attacker
behavior and then label the data into two classes of abnormal and normal. We use the optimized NSL-KDD
dataset from the KDD-99 dataset to test and evaluate machine learning models. The test results have low
errors, it can be said that the efficiency from our models has been more optimized and more complete.
Keyword. machine learning, random forest, network security, abnormal detection, cyber attack.
1 GIỚI THIỆU
Trong những năm gần đây, sự gia tăng tần suất xuất hiện của các cuộc tấn công mạng đã khiến các vấn đề
liên quan đến an ninh mạng dần trở nên quan ngại đối với người dùng. Sự xuất hiện của các công nghệ
mạng thông minh mới đòi hỏi phát triển các phương pháp mới trong an ninh mạng. Để bảo vệ các cơ sở hạ
tầng quan trọng khỏi các cuộc tấn công và truy cập trái phép. Các cuộc tấn công hiện nay đang trở nên vô
cùng đa dạng và tinh vi. Các loại mã độc và thủ đoạn tấn công ngày càng phức tạp và rất khó phát hiện.
Học máy (Machine Learning) - một xu hướng nghiên cứu chuyên sâu trong lĩnh vực của nhân tạo thông
minh và mở ra nhiều cơ hội mới trong tự đồng hóa, phân tích dữ liệu lớn. Nhờ sự tiến bộ trong công nghệ
mới, học máy, ta có thể áp dụng công nghệ trí tuệ nhân tạo nhằm phát hiện bất thường trong an ninh mạng,