Siêu thị PDFTải ngay đi em, trời tối mất

Thư viện tri thức trực tuyến

Kho tài liệu với 50,000+ tài liệu học thuật

© 2023 Siêu thị PDF - Kho tài liệu học thuật hàng đầu Việt Nam

Trí tuệ nhân tạo trong chuyển đổi số: ứng dụng hỗ trợ thu thập chỉ số đường huyết của thai phụ :Luận văn thạc sĩ - Chuyên ngành: Khoa học máy tính
PREMIUM
Số trang
85
Kích thước
3.9 MB
Định dạng
PDF
Lượt xem
1236

Trí tuệ nhân tạo trong chuyển đổi số: ứng dụng hỗ trợ thu thập chỉ số đường huyết của thai phụ :Luận văn thạc sĩ - Chuyên ngành: Khoa học máy tính

Nội dung xem thử

Mô tả chi tiết

BỘ CÔNG THƯƠNG

TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP THÀNH PHỐ HỒ CHÍ MINH

NGUYỄN PHẠM THANH TÂM

TRÍ TUỆ NHÂN TẠO TRONG CHUYỂN ĐỔI

SỐ: ỨNG DỤNG HỖ TRỢ THU THẬP CHỈ SỐ

ĐƯỜNG HUYẾT CỦA THAI PHỤ

Chuyên ngành: KHOA HỌC MÁY TÍNH

Mã chuyên ngành: 60.48.01.01

LUẬN VĂN THẠC SĨ

THÀNH PHỐ HỒ CHÍ MINH, NĂM 2020

Công trình được hoàn thành tại Trường Đại học Công nghiệp TP. Hồ Chí Minh.

Người hướng dẫn khoa học: PGS.TS Huỳnh Trung Hiếu.

Người phản biện 1: TS Huỳnh Khả Tú.

Người phản biện 2: TS Lê Nhật Duy.

Luận văn thạc sĩ được bảo vệ tại Hội đồng chấm bảo vệ Luận văn thạc sĩ Trường

Đại học Công nghiệp thành phố Hồ Chí Minh ngày 30 tháng 05 năm 2020.

Thành phần Hội đồng đánh giá luận văn thạc sĩ gồm:

1. PGS.TS Huỳnh Tường Nguyên .....................- Chủ tịch Hội đồng

2. TS Huỳnh Khả Tú .........................................- Phản biện 1

3. TS Lê Nhật Duy ............................................- Phản biện 2

4. TS Đặng Thị Phúc .........................................- Ủy viên

5. TS Phạm Thị Thuyết......................................- Thư ký

(Ghi rõ họ, tên, học hàm, học vị của Hội đồng chấm bảo vệ luận văn thạc sĩ)

CHỦ TỊCH HỘI ĐỒNG TRƯỞNG KHOA

CÔNG NGHỆ THÔNG TIN

HUỲNH TƯỜNG NGUYÊN HUỲNH TRUNG HIẾU

NHIỆM VỤ LUẬN VĂN THẠC SĨ

Họ tên học viên: Nguyễn Phạm Thanh Tâm MSHV: 17112881

Ngày, tháng, năm sinh: 28/02/1986 Nơi sinh: Đồng Tháp

Chuyên ngành: Khoa học máy tính Mã chuyên ngành: 60480101

I. TÊN ĐỀ TÀI:

Trí tuệ nhân tạo trong chuyển đổi số: Ứng dụng hỗ trợ thu thập chỉ số đường huyết

của thai phụ.

NHIỆM VỤ VÀ NỘI DUNG:

- Nghiên cứu giải pháp số hóa dữ liệu (digitalization).

- Tiền xử lý dữ liệu dựa trên yêu cầu ứng dụng AI và hiện thực prototype giải pháp

AI.

- Ứng dụng xử lý thu thập dữ liệu từ Phiếu theo dõi chỉ số đường huyết của thai

phụ.

- Phân tích kết quả và đưa ra hướng phát triển.

II. NGÀY GIAO NHIỆM VỤ: 06/09/2019

III. NGÀY HOÀN THÀNH NHIỆM VỤ: 06/03/2020

IV. NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS. TS. Huỳnh Trung Hiếu

Tp. Hồ Chí Minh, ngày … tháng 06 năm 2020

NGƯỜI HƯỚNG DẪN CHỦ NHIỆM BỘ MÔN ĐÀO TẠO

TRƯỞNG KHOA CÔNG NGHỆ THÔNG TIN

BỘ CÔNG THƯƠNG

TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP

THÀNH PHỐ HỒ CHÍ MINH

CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM

Độc lập - Tự do - Hạnh phúc

i

LỜI CẢM ƠN

Để hoàn thành được bài luận văn thạc sĩ này, tôi xin bày tỏ sự cảm kích đặc biệt tới

cố vấn của tôi, Phó giáo sư Tiến sĩ Huỳnh Trung Hiếu - Người đã định hướng, trực

tiếp dẫn dắt và cố vấn cho tôi trong suốt thời gian thực hiện đề tài nghiên cứu khoa

học. Tôi xin gửi lời cảm ơn đến thầy bằng tất cả tấm lòng và sự biết ơn của mình.

Đề tài được hỗ trợ một phần bởi Sở Khoa học và Công nghệ Thành phố Hồ Chí

Minh theo Quyết định số 1131/QĐ-SKHCN và Hợp đồng số 06/2018/HĐ-QKHCN.

Tôi cũng xin gửi lời cảm ơn chân thành đến thầy Lê Nhật Duy – Phó khoa Công

nghệ thông tin đã hướng dẫn và giúp đỡ các biểu mẫu và quy trình hoàn thành đề tài

luận văn từ khi bắt đầu đăng ký đề cương đến khi bảo vệ luận văn.

Tôi xin trân trọng cảm ơn Phòng quản lý Sau đại học đã giúp đở tôi về các thủ tục

cần thiết để hoàn thành luận văn.

Sau cùng, tôi xin tỏ lòng biết ơn đến Trung tâm Công nghệ thông tin và Truyền

thông Đồng Tháp – Cơ quan nới tôi công tác, đã tạo điều kiện về thời gian, công

việc để tôi có thể hoàn thành luận văn thạc sĩ.

Xin chân thành cảm ơn tất cả mọi người và quý cơ quan!

ii

TÓM TẮT LUẬN VĂN THẠC SĨ

Sự phát triển của công nghệ số đã mang lại những lợi ích đáng kể trong nhiều lĩnh

vực khác nhau của đời sống xã hội. Một trong các công nghệ đóng vai trò hết sức

quan trọng trong hoàn thiện chuyển đổi số là OCR (Optical Character Recognition).

Nó cho phép chuyển đổi các hình ảnh, text dạng đánh máy hoặc viết tay, cũng như

các tài liệu scan vào dạng text mà máy tính có thể đọc được và soạn thảo được.

Trong lĩnh vực y tế, các chuyên gia cần quản lý lượng lớn dữ liệu bệnh nhân và tăng

liên tục. Sẽ rất hữu ích khi thông tin được lưu trữ trong cơ sở dữ liệu. Với công cụ

xử lý OCR, chúng ta có thể trích xuất dữ liệu từ các cấu trúc và lưu trữ vào cơ sở dữ

liệu, từ đó giúp cho việc truy xuất, tìm kiếm, phân tích được dễ dàng hơn về sau.

Trong luận văn này, chúng tôi kết hợp các tiếp cận AI hiện đại để hỗ trợ việc trích

xuất thông tin, chuyển đổi dữ liệu từ dạng phi cấu trúc sang dạng cấu trúc, lưu trữ

vào cơ sở dữ liệu để phục vụ cho các bước xử lý tiếp theo. Mục tiêu của nghiên cứu

này là phát triển giải pháp tích hợp trí tuệ nhân tạo trong việc rút trích thông tin từ

form, nhằm tăng tính tự động và độ chính xác trong quá trình chuyển đổi số. Nâng

cao hiệu quả quá trình số hóa dữ liệu được thu thập trong lĩnh vực y tế.

Sản phẩm đề tài khi hoàn thành sẽ giúp các chuyên gia thực hiện các dự án nghiên

cứu có yêu cầu thu thập, phân tích và theo dõi diễn tiến thay đổi của các chỉ số sức

khỏe một cách nhanh chóng, tiết kiệm thời gian nhập liệu thủ công. Ngoài việc triển

khai thu thập dữ liệu cho việc giám sát bệnh đái tháo đường thai kỳ, hệ thống có thể

hỗ trợ việc thu thập và trực quan hóa dữ liệu các bệnh khác cũng như một số bài

toán khác. Hỗ trợ việc tích hợp dữ liệu từ nhiều nguồn khác nhau.

iii

LỜI CAM ĐOAN

Tôi xin cam đoan đây là công trình nghiên cứu của bản thân tôi. Các kết quả nghiên

cứu và các kết luận trong luận văn là trung thực, không sao chép từ bất kỳ một

nguồn nào và dưới bất kỳ hình thức nào. Việc tham khảo các nguồn tài liệu (nếu có)

đã được thực hiện trích dẫn và ghi nguồn tài liệu tham khảo đúng quy định.

Học viên

(Chữ ký)

Nguyễn Phạm Thanh Tâm

iv

MỤC LỤC

MỤC LỤC .............................................................................................................iv

DANH MỤC HÌNH ẢNH ......................................................................................vi

DANH MỤC BẢNG BIỂU ..................................................................................viii

DANH MỤC TỪ VIẾT TẮT .................................................................................ix

MỞ ĐẦU ................................................................................................................1

1. Đặt vấn đề ...........................................................................................................1

2. Mục tiêu nghiên cứu ............................................................................................2

3. Đối tượng và phạm vi nghiên cứu ........................................................................3

4. Cách tiếp cận và phương pháp nghiên cứu...........................................................3

5. Ý nghĩa thực tiễn của đề tài .................................................................................4

CHƯƠNG 1 TỔNG QUAN VỀ LĨNH VỰC NGHIÊN CỨU ............................5

CHƯƠNG 2 CƠ SỞ LÝ THUYẾT....................................................................9

2.1 Tổng quan về Tesseract-ocr:.......................................................................9

2.1.1 Lịch sử:.......................................................................................................9

2.1.2 Kiến trúc hoạt động: .................................................................................11

2.1.3 Huấn luyện dữ liệu trên Tesseract:............................................................12

2.1.4 Quá trình huấn luyện ngôn ngữ và font mới:.............................................14

2.1.5 Tiến trình nhận dạng sử dụng Tesseract OCR: ..........................................17

2.2 Định vị ký tự bằng CTPN (Connectionist Text Proposal Network):..........19

2.2.1 Giới thiệu về CTPN: .................................................................................19

2.2.2 Kiến trúc của CTPN:.................................................................................20

2.2.3 So sánh kết quả với các mô hình khác:......................................................21

2.3 Nhận dạng chữ viết tay bằng OCR: ..........................................................22

2.4 Thư viện OpenCV: ...................................................................................23

2.4.1 Giới thiệu về thư viện OpenCV:................................................................23

2.4.2 Phiên bản opencv 1 và opencv 2: ..............................................................23

2.4.3 Hough Line Transform: ............................................................................27

v

2.5 Tập dữ liệu chữ số viết tay MNIST: .........................................................31

2.6 Thư viện TensorFlow: ..............................................................................32

2.7 Giới thiệu các công cụ lập trình và môi trường vận hành Ứng dụng hỗ trợ

thu thập chỉ số đường huyệt của thai phụ:..............................................................33

2.7.1 Anaconda và Jupiter: ................................................................................33

2.7.2 Visual studio và Xamarin:.........................................................................34

2.7.3 Môi trường cài đặt vận hành: ....................................................................35

CHƯƠNG 3 PHƯƠNG PHÁP NGHIÊN CỨU ...............................................36

3.1 Mô hình kiến trúc hệ thống:......................................................................37

3.2 Phân tích thiết kế hệ thống thu thập chỉ số đường huyết của thai phụ: ......39

3.2.1 Sơ đồ Usecase:..........................................................................................41

3.2.2 Sơ đồ Hoạt động: ......................................................................................42

3.2.3 Sơ đồ Tuần tự: ..........................................................................................44

3.2.4 Sơ đồ Class:..............................................................................................46

3.3 Lược đồ quá trình xử lý form nhập liệu ảnh phiếu theo dõi chỉ số đường

huyết thông qua phần mềm di động: ......................................................................47

CHƯƠNG 4 THỰC NGHIỆM VÀ ĐÁNH GIÁ KẾT QUẢ ............................53

4.1 Thực nghiệm: ...........................................................................................53

4.1.1 Tiền xử lý dữ liệu: ....................................................................................53

4.1.2 Nhận dạng thông tin cá nhân bệnh nhân từ ảnh chụp:................................54

4.1.3 Nhận dạng thông tin chỉ số đường huyết từ ảnh chụp:...............................60

4.1.4 Lưu trữ thông tin thu thập vào cơ sở dữ liệu và trích xuất thông tin: .........62

4.2 Đánh giá kết quả:......................................................................................63

KẾT LUẬN VÀ KIẾN NGHỊ ...............................................................................66

TÀI LIỆU THAM KHẢO .....................................................................................67

PHỤ LỤC..............................................................................................................71

LÝ LỊCH TRÍCH NGANG CỦA HỌC VIÊN.......................................................73

Tải ngay đi em, còn do dự, trời tối mất!