Siêu thị PDFTải ngay đi em, trời tối mất

Thư viện tri thức trực tuyến

Kho tài liệu với 50,000+ tài liệu học thuật

© 2023 Siêu thị PDF - Kho tài liệu học thuật hàng đầu Việt Nam

Nghiên cứu phương pháp nhận dạng chữ quang học và ứng dụng nhận dạng thẻ bảo hiểm y tế
PREMIUM
Số trang
112
Kích thước
7.6 MB
Định dạng
PDF
Lượt xem
1402

Nghiên cứu phương pháp nhận dạng chữ quang học và ứng dụng nhận dạng thẻ bảo hiểm y tế

Nội dung xem thử

Mô tả chi tiết

`

ĐẠI HỌC ĐÀ NẴNG

TRƯỜNG ĐẠI HỌC SƯ PHẠM

NGÔ TẤN LÂM

NGHIÊN CỨU PHƯƠNG PHÁP NHẬN DẠNG

CHỮ QUANG HỌC VÀ ỨNG DỤNG NHẬN

DẠNG THẺ BẢO HIỂM Y TẾ

Chuyên ngành: Hệ thống thông tin

Mã số: 61.49.01.04

TÓM TẮT LUẬN VĂN THẠC SĨ

HỆ THỐNG THÔNG TIN

ĐÀ NẴNG - NĂM 2017

Công trình được hoàn thành tại

ĐẠI HỌC ĐÀ NẴNG

TRƯỜNG ĐẠI HỌC SƯ PHẠM

Người hướng dẫn khoa học: TS. PHẠM ANH PHƯƠNG

Phản biện 1: PGS.TS Võ Trung Hùng

Phản biện 2: GS.TS. Nguyễn Thanh Thủy

Luận văn đã bảo vệ trước Hội đồng chấm Luận văn tốt

nghiệp thạc sĩ Hệ thống thông tin, họp tại Đại học Đà Nẵng

vào ngày 30 tháng 7 năm 2017.

Có thể tìm hiểu luận văn tại:

- Thư viện Trường Đại học Sư phạm, Đại học Đà Nẵng

1

MỞ ĐẤU

1. TÍNH CẤP THIẾT CỦA ĐỀ TÀI

Trong thời đại hiện nay, với sự phát triển mạnh mẽ của công

nghệ thông tin, bài toán nhận dạng là một lĩnh vực đang được quan

tâm và phát triển. Bài toán nhận dạng đóng vai trò quan trọng trong

nhiều ứng dụng thực tế như: giám sát an ninh, giao thông, nhận dạng

trong y học, nhận dạng đối tượng, nhận dạng khuôn mặt, nhận dạng

chữ, nhận dạng tiếng nói, phát hiện chuyển động, theo dõi chuyển

động,…

Cùng với sự thúc đẩy của quá trình tin học hóa trong lĩnh vực y

tế, đầu tháng 7 năm 2016, Bảo hiểm xã hội Việt Nam đã triển khai

việc cấp phát thẻ bảo hiểm y tế (BHYT) theo cấu trúc mã thẻ mới có

mã vạch 2 chiều cho tất cả các đối tượng tham gia BHYT, việc sử

dụng thẻ BHYT mã vạch 2 chiều đã mang lại nhiều tiện ích cho các

cơ sở khám chữa bệnh và người dân tham gia BHYT khi đi khám

chữa bệnh, đảm bảo sự chính xác thông tin trong việc cấp phát thẻ

BHYT cho bệnh nhân. Tuy nhiên trong quá trình triển khai còn gặp

nhiều những khó khăn như: việc đầu tư cơ sở vật chất chưa đồng bộ,

cần có lộ trình và kinh phí, trình độ tin học, công nghệ thông tin của

nhân viên ở các cơ sở khám chữa bệnh vẫn chưa theo kịp đà phát

triển của công nghệ…, một vấn đề khó khăn nữa là một số thẻ mới

phát hành đã bị mờ, mực in bị bong tróc, không rõ thông tin, máy

không đọc được mã vạch…gây khó khăn cho người dân lẫn các cơ sở

khám chữa bệnh, nhiều người ở xa đến, không khám bảo hiểm được

phải tự chi trả hoặc phải quay về xin cấp lại thẻ, mất thời gian, khó

khăn và tốn kém cho người bệnh.

Xuất phát từ thực tiễn trên, Tôi ứng dụng sức mạnh của công

2

nghệ thông tin trong lĩnh vực máy học để thực hiện đề tài “Nghiên

cứu phƣơng pháp nhận dạng chữ quang học và ứng dụng nhận

dạng thẻ bảo hiểm y tế”. Nhận dạng thẻ BHYT là một chương trình

hỗ trợ trong việc quản lý BHYT, từ kết quả nhận dạng mã số trên thẻ

BHYT nó giúp người quản lý tìm kiếm, trích xuất được thông tin về

bệnh nhân dựa trên thẻ BHYT một cách nhanh chóng, chính xác, hạn

chế tình trạng trùng thẻ BHYT, đảm bảo cho việc thanh toán BHYT

chính xác đạt hiệu quả cao, hạn chế tiêu cực, đồng thời theo dõi

xuyên suốt quá trình điều trị bệnh của bệnh nhân. Trong đề tài này,

Tôi sẽ nghiên cứu một số phương pháp nhận dạng trong lĩnh vực

nhận dạng chữ quang học. Từ đó, chúng ta sẽ có cách nhìn rõ nét hơn

về lĩnh vực máy học, hiểu được tầm quan trọng và tính thực tiễn của

nó trong cuộc sống con người.

2. MỤC TIÊU

- Nghiên cứu các phương pháp nhận dạng ảnh, nhận dạng ký

tự quang học và một số phương pháp trích chọn đặc trưng của ảnh.

- Xây dựng, cài đặt thuật toán nhận dạng để giải quyết bài toán

nhận dạng thẻ BHYT dựa trên việc thu thập số liệu, xây dựng cơ sở

tri thức và ứng dụng trong việc nhận dạng thẻ BHYT.

3. ĐỐI TƢỢNG VÀ PHẠM VI NGHIÊN CỨU

3.1. Đối tƣợng nghiên cứu

Các phương pháp nhận dạng ảnh, nhận dạng ký tự quang học.

3.2. Phạm vi nghiên cứu

- Ảnh thẻ BHYT.

- Ảnh chụp trong điều kiện ánh sáng bình thường (không chụp

ngược ánh sáng, chụp bằng máy kỹ thuật số hoặc máy scan).

- Các ký tự rời rạc, không bị dính.

3

4. PHƢƠNG PHÁP NGHIÊN CỨU

Để hoàn thành mục tiêu đề ra, tôi chọn phương pháp nghiên

cứu lý thuyết và tiến hành ứng dụng thực nghiệm. Cụ thể như sau:

- Về lý thuyết: Tham khảo các tài liệu lý thuyết liên quan.

- Về thực nghiệm:

+ Thu thập dữ liệu ảnh thẻ BHYT để xây dựng cơ sở tri thức.

+ Ứng dụng nhận dạng thẻ BHYT trên dữ liệu ảnh thu thập

được.

5. KẾT QUẢ DỰ KIẾN

5.1. Lý thuyết

- Nghiên cứu tổng quan về nhận dạng ảnh, nhận dạng ký tự

quang học.

- Nghiên cứu về lĩnh vực máy học, các phương pháp nhận

dạng: Phương phương pháp Máy vector hỗ trợ (Support Vector

Machine); Mạng nơ-ron nhân tạo (Artificial Neural Network),…để

làm cơ sở cho việc phân tích dữ liệu.

- Tìm hiểu về lập trình với OpenCV, Matlab.

5.2. Thực tiễn

Từ kết quả nhận dạng mã thẻ BHYT, dùng để hỗ trợ cho việc

quản lý thẻ BHYT trong khám chữa bệnh tại các cơ sở y tế.

6. BỐ CỤC LUẬN VĂN

Luận văn dự kiến tổ chức thành 3 chương chính như sau:

Chƣơng 1: TỔNG QUAN VỀ NHẬN DẠNG CHỮ

QUANG HỌC

Chƣơng 2: MẠNG NƠ-RON NHÂN TẠO

Chƣơng 3: ỨNG DỤNG NHẬN DẠNG THẺ BHYT

Cuối cùng là phần kết luận và hướng nghiên cứu phát triển của

luận văn.

4

CHƢƠNG 1

TỔNG QUAN VỀ NHẬN DẠNG CHỮ QUANG HỌC

Chương này giới thiệu khái quát về nhận dạng chữ quang học,

mô hình nhận dạng ký tự tổng quát, các khái niệm cơ bản về xử lý

ảnh và một số kỹ thuật, phương pháp nhận dạng chữ áp dụng trong

lĩnh vực nhận dạng.

Cho đến nay các kết quả nghiên cứu nhận dạng ở lĩnh vực này

vẫn còn hạn chế, các ứng dụng chủ yếu chỉ tập trung ở một số lĩnh

vực hẹp. Có nhiều mô hình, kỹ thuật tiên tiến trong lĩnh vực máy học

đang được áp dụng cho bài toán nhận dạng chữ như: mạng nơ-ron

nhân tạo, mô hình Markov ẩn, máy véc tơ hỗ trợ (SVM),...

CHƢƠNG 2

MẠNG NƠ-RON NHÂN TẠO

Chương này giới thiệu về mạng nơ-ron nhân tạo. Từ những đặc

trưng, tính năng của mạng nơ-ron nhân tạo là mạng có khả năng học

và là một hệ thống gồm nhiều phần tử xử lý đơn giản cùng hoạt động

xử lý song song, cho phép nó có thể được áp dụng để giải các bài

toán từ đơn giản đến phức tạp.

Đặc biệt là bài toán phân lớp, đây là loại bài toán này đòi hỏi

giải quyết vấn đề phân loại các đối tượng quan sát được thành các

nhóm dựa trên các đặc điểm của các nhóm đối tượng đó. Đồng thời là

dạng bài toán cơ sở của rất nhiều bài toán trong thực tế như: nhận

dạng chữ, tiếng nói, phân loại gen, phân loại chất lượng sản

phẩm,…Do đó, mạng nơ-ron perceptron một lớp là thuật toán được

lựa chọn để cài đặt ứng dụng trong việc nhận dạng thẻ.

5

CHƢƠNG 3

ỨNG DỤNG NHẬN DẠNG THẺ BHYT

Trong chương này, Tôi đưa một chương trình mô phỏng được

xây dựng và cài đặt dựa trên thuật toán mạng nơ-ron perceptron một

lớp truyền thẳng để huấn luyện, nhận dạng 18 chữ cái từ A đến Y và

10 chữ số từ 0 đến 9 và bộ dữ liệu mẫu gồm 200 file ảnh dùng để

kiểm thử hận dạng. Đây là các ký tự thường được dùng trong việc

cấp phát mã số trên thẻ BHYT dùng trong việc khám chữa bệnh tại

các cơ sở y tế. Dựa trên kết quả nhận dạng được từ chương trình,

người ta có thể dùng truy xuất dữ liệu và quản lý thẻ BHYT đạt hiệu

quả qua đó nâng cao hiệu suất trong quản lý và đồng thời theo dõi

xuyên suốt quá trình khám chữa bệnh cho bệnh nhân.

3.1. BÀI TOÁN NHẬN DẠNG THẺ BẢO HIỂM Y TẾ

Nhận dạng thẻ BHYT là một chương trình hỗ trợ trong hệ

thống quản lý BHYT, mô tả bài toán như sau:

- Đầu vào: Dữ liệu là các file ảnh dạng văn bản có định dạng

*.JPG trải qua các giai đoạn tiền xử lý: xử lý ảnh nhiễu, phân

ngưỡng, lọc ảnh..., phân tích ảnh và tách ký tự theo từng vùng sau đó

được huấn huyện dựa trên mạng nơ-ron nhân tạo và nhận dạng đưa ra

kết quả.

- Đầu ra: là một file text chứa các ký tự tương ứng với mã thẻ

BHYT mà chương trình mong muốn. Số ký tự đầu ra mong muốn

phải tương ứng với số ký tự ảnh đầu vào cần huấn luyện.

Dựa trên kết quả mã thẻ BHYT đã được nhận dạng, giúp

người quản lý có thể dùng để tìm kiếm, trích xuất được thông tin về

bệnh nhân một cách nhanh chóng, chính xác, hạn chế tình trạng trùng

6

thẻ BHYT, đảm bảo cho việc thanh toán BHYT chính xác đạt hiệu

quả cao, đồng thời có thể theo dõi xuyên suốt quá trình điều trị bệnh

của bệnh nhân.

3.2. CƠ SỞ DỮ LIỆU THỰC NGHIỆM

Tập dữ liệu mẫu dùng để huấn luyện chứa 28 file ảnh, với

kích thước 16×20, định dạng *.JPG, tương ứng với từng ký tự: gồm

các ký tự số từ 0 đến 9 và các ký tự chữ cái gồm A, B, C, D, E, G, H,

K, L, M, N, O, Q, S, T, V, X, Y.

A B C D X Y 0 1 2 3 5 8 9

Hình 3.1. Một số mẫu ký tự

Tập dữ liệu dùng để kiểm thử chứa: các file ảnh của thẻ

BHYT, định dạng *.JPG. Mỗi file ảnh được lưu với tên theo định

dạng:

<Mã thẻ BHYT>.JPG

Ví dụ: CH4480405300003.JPG

Hình 3.2. Mẫu thẻ BHYT dùng để kiểm thử

7

3.3. MÔ HÌNH NHẬN DẠNG THẺ BHYT

Hình 3.3. Mô hình nhận dạng thẻ BHYT

8

3.3.1. Thẻ BHYT

Hình 3.4. Thẻ bảo hiểm y tế

- Ô thứ nhất 02 ký tự: Gồm 2 chữ cái là mã đối tượng tham gia

BHYT gồm 34 loại đối tượng, có ký hiệu : DN, HX, CH, NN, TK,

HC, XK, CA, HT, TB, MS, XB, XN, TN, CC, CK, CB, KC, HD, BT,

HN, TC, TQ, TA, TY, TE, HG, LS, CN, HS, GD, TL, XV, NO.

- Ô thứ hai 01 ký tự: Được ký hiệu bằng số (theo thứ tự từ 1

đến 5), quy định mức hưởng BHYT.

- Ô thứ ba 02 ký tự: Được ký hiệu bằng số từ 01 đến 99 là mã

tỉnh, thành phố trực thuộc trung ương, nơi phát hành thẻ BHYT.

- Ô thứ tư 02 ký tự: Được ký hiệu bằng số từ 01 đến 99 là mã

quận, huyện, thị xã, thành phố trực thuộc tỉnh nơi quản lý đầu mối

của người tham gia BHYT.

- Ô thứ năm 03 ký tự: Được ký hiệu bằng số từ 001 đến 999 là

mã đơn vị quản lý, theo địa giới hành chính và theo loại đối tượng.

9

- Ô thứ sáu 05 ký tự: Được ký hiệu bằng số từ 00001 đến

99999 là số thứ tự của người tham gia BHYT trong 01 đơn vị.

3.3.2. Tiền xử lý

Giai đoạn này góp phần làm tăng độ chính xác phân lớp của hệ

thống nhận dạng, tuy nhiên nó cũng làm cho tốc độ nhận dạng của hệ

thống chậm lại. Vì vậy, tùy thuộc vào chất lượng ảnh quét vào để chọn

một hoặc một vài chức năng trong khối này. Nếu cần ưu tiên tốc độ xử

lý và chất lượng của máy quét tốt thì có thể bỏ qua giai đoạn này

Ảnh đầu vào sau khi được xử lý là một ảnh có 256 mức xám,

được tách nhiễu và phân ngưỡng và chỉ lấy những điểm trên ảnh có

màu lân cận đen, các điểm còn lại chuyển về màu trắng. Từ ảnh thu

được ta nhị phân hóa thành ảnh nhị phân. Mục đích của việc này là

làm nổi phần mã thẻ và thông tin trên thẻ. Sau đó, ảnh ta thu được là

ảnh chỉ chứa những thông tin về thẻ và ta tìm góc nghiêng của ảnh

(nếu có) và tiến hành quay ảnh bằng phép biến đổi Hough.

3.3.2.1. Phép quay ảnh

Ý tưởng của việc áp dụng biến đổi Hough đã nêu ở chương 1

trong việc tìm góc nghiêng văn bản là dùng một mảng tích luỹ để

đếm số điểm ảnh nằm trên một đường thẳng trong không gian ảnh.

Mảng tích luỹ là một mảng hai chiều với chỉ số hàng của mảng cho

biết góc lệch

của một đường thẳng và chỉ số cột chính là giá trị r

khoảng cách từ gốc toạ độ tới đường thẳng đó. Sau đó tính tổng số

điểm ảnh nằm trên những đường thẳng song song nhau theo các góc

lệch thay đổi. Góc nghiêng văn bản tương ứng với góc có tổng giá trị

mảng tích luỹ cực đại.

Ảnh đầu vào được giới hạn góc của ảnh trong phạm vi góc

thuộc khoảng [0:45] và ảnh không bị ngược.

Tải ngay đi em, còn do dự, trời tối mất!