Thư viện tri thức trực tuyến
Kho tài liệu với 50,000+ tài liệu học thuật
© 2023 Siêu thị PDF - Kho tài liệu học thuật hàng đầu Việt Nam

Dự Đoán Tác Dụng Phụ Của Thuốc Từ Y Văn Sử Dụng Mô Hình Lai Dựa Trên Mạng Nơ Ron
Nội dung xem thử
Mô tả chi tiết
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
──────── * ───────
NGUYỄN ĐỨC ĐÔNG
DỰ ĐOÁN TÁC DỤNG PHỤ CỦA THUỐC TỪ Y VĂN
SỬ DỤNG MÔ HÌNH LAI DỰA TRÊN MẠNG NƠ RON
LUẬN VĂN THẠC SĨ HỆ THỐNG THÔNG TIN
HÀ NỘI 06 – 2021
2
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
──────── * ───────
NGUYỄN ĐỨC ĐÔNG
DỰ ĐOÁN TÁC DỤNG PHỤ CỦA THUỐC TỪ Y VĂN
SỬ DỤNG MÔ HÌNH LAI DỰA TRÊN MẠNG NƠ RON
NGÀNH : CÔNG NGHỆ THÔNG TIN
CHUYÊN NGÀNH : HỆ THỐNG THÔNG TIN
MÃ SỐ : 8480104.01
LUẬN VĂN THẠC SĨ HỆ THỐNG THÔNG TIN
NGƯỜI HƯỚNG DẪN KHOA HỌC: TS. ĐẶNG THANH HẢI
HÀ NỘI 06 – 2021
3
LỜI CAM ĐOAN
Với mục đích học tập, nghiên cứu để nâng cao kiến thức và trình độ chuyên
môn nên tôi đã làm luận văn này một cách nghiêm túc và hoàn toàn trung thực.
Trong luận văn tôi có sử dụng một số tài liệu tham khảo của một số tác giả. Tôi
đã chú thích và nêu ra trong phần tài liệu tham khảo ở cuối luận văn.
Tôi xin cam đoan và chịu trách nhiệm về nội dung và sự trung thực trong luận
văn tốt nghiệp Thạc sĩ của mình.
Hà Nội, ngày 20 tháng 06 năm 2021
Nguyễn Đức Đông
4
LỜI CẢM ƠN
Lời đầu tiên, tôi xin chân thành cảm ơn các thầy cô giáo trong trường Đại Học
Công Nghệ - Đại học Quốc Gia Hà Nội, đặc biệt là các thầy cô của khoa Công Nghệ
Thông Tin đã truyền đạt cho tôi những kiến thức, kinh nghiệm vô cùng quý báu trong
suốt thời gian học tập tại trường.
Tôi xin gửi lời cảm ơn đến TS. Đặng Thanh Hải – giảng viên khoa Công Nghệ
Thông tin – Trường Đại học Công Nghệ đã tận tình giúp đỡ và hướng dẫn tận tình
trong suốt quá trình làm luận văn.
Cuối cùng, tôi xin được cảm ơn đến gia đình, bạn bè đã động viên, đóng góp ý
kiến và giúp đỡ trong quá trình nghiên cứu và hoàn thành luận văn.
Do thời gian, kiến thức và kinh nghiệm của tôi còn hạn chế nên khóa luận
không thể tránh khỏi những sai sót. Tôi hy vọng sẽ nhận được những ý kiến nhận xét,
góp ý của các thầy cô giáo và các bạn để đồ án được hoàn hiện hơn.
Tôi xin chân thành cảm ơn!
Hà Nội, ngày 20 tháng 06 năm 2021
Nguyễn Đức Đông
5
MỤC LỤC
LỜI CAM ĐOAN.................................................................................................3
LỜI CẢM ƠN.......................................................................................................4
MỤC LỤC............................................................................................................5
DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT ..........................................7
DANH MỤC HÌNH VẼ.......................................................................................8
DANH MỤC BẢNG BIỂU..................................................................................9
MỞ ĐẦU............................................................................................................10
CHƯƠNG 1: CƠ SỞ LÝ THUYẾT...................................................................12
1.1. THUỐC VÀ QUY TRÌNH PHÁT TRIỂN THUỐC ..............................12
1.1.1. Quy trình phát triển thuốc (Drug development process) .................12
1.1.2. Tác dụng phụ của thuốc ...................................................................14
1.2. KHAI PHÁ DỮ LIỆU VÀ CÁC THUẬT NGỮ LIÊN QUAN..............15
1.2.1. Định nghĩa về khai phá dữ liệu ........................................................15
1.2.2. Bài toán phân lớp dữ liệu .................................................................15
1.2.3. Học sâu và mạng nơ ron...................................................................16
1.2.4. Đánh giá mô hình phân lớp..............................................................20
CHƯƠNG 2: DỰ ĐOÁN TÁC DỤNG PHỤ CỦA THUỐC............................21
2.1. Bài toán dự đoán tác dụng phụ của thuốc từ y văn ................................21
2.1.1. Bài toán nhận dạng thực thể bệnh lý và thực thể thuốc (Named
Entity Recognition – NER) [11] ................................................................21
2.1.2. Bài toán trích xuất mối quan hệ bệnh lý do thuốc gây ra (ChemicalInduced Disease – CID).............................................................................22
2.2. Bộ dữ liệu BioCreative V CDR...............................................................24
2.2.1. Giới thiệu về Pubmed.......................................................................24
2.2.2. Dữ liệu quan hệ thuốc và bệnh - BioCreative V CDR.....................24
2.2.3. Cấu trúc kho dữ liệu BioCreative V CDR .......................................25
2.2.4. Cách thức xử lý dữ liệu BioCreative V CDR làm đầu vào cho bài
toán trích xuất quan hệ thuốc và bệnh lý ...................................................28
2.3. Mô hình lai dựa trên mạng nơ ron...........................................................31