Thư viện tri thức trực tuyến
Kho tài liệu với 50,000+ tài liệu học thuật
© 2023 Siêu thị PDF - Kho tài liệu học thuật hàng đầu Việt Nam

Nghiên cứu phương pháp nhận dạng chữ quang học và ứng dụng nhận dạng thẻ bảo hiểm y tế
Nội dung xem thử
Mô tả chi tiết
`
ĐẠI HỌC ĐÀ NẴNG
TRƯỜNG ĐẠI HỌC SƯ PHẠM
NGÔ TẤN LÂM
NGHIÊN CỨU PHƯƠNG PHÁP NHẬN DẠNG
CHỮ QUANG HỌC VÀ ỨNG DỤNG NHẬN
DẠNG THẺ BẢO HIỂM Y TẾ
Chuyên ngành: Hệ thống thông tin
Mã số: 61.49.01.04
TÓM TẮT LUẬN VĂN THẠC SĨ
HỆ THỐNG THÔNG TIN
ĐÀ NẴNG - NĂM 2017
Công trình được hoàn thành tại
ĐẠI HỌC ĐÀ NẴNG
TRƯỜNG ĐẠI HỌC SƯ PHẠM
Người hướng dẫn khoa học: TS. PHẠM ANH PHƯƠNG
Phản biện 1: PGS.TS Võ Trung Hùng
Phản biện 2: GS.TS. Nguyễn Thanh Thủy
Luận văn đã bảo vệ trước Hội đồng chấm Luận văn tốt
nghiệp thạc sĩ Hệ thống thông tin, họp tại Đại học Đà Nẵng
vào ngày 30 tháng 7 năm 2017.
Có thể tìm hiểu luận văn tại:
- Thư viện Trường Đại học Sư phạm, Đại học Đà Nẵng
1
MỞ ĐẤU
1. TÍNH CẤP THIẾT CỦA ĐỀ TÀI
Trong thời đại hiện nay, với sự phát triển mạnh mẽ của công
nghệ thông tin, bài toán nhận dạng là một lĩnh vực đang được quan
tâm và phát triển. Bài toán nhận dạng đóng vai trò quan trọng trong
nhiều ứng dụng thực tế như: giám sát an ninh, giao thông, nhận dạng
trong y học, nhận dạng đối tượng, nhận dạng khuôn mặt, nhận dạng
chữ, nhận dạng tiếng nói, phát hiện chuyển động, theo dõi chuyển
động,…
Cùng với sự thúc đẩy của quá trình tin học hóa trong lĩnh vực y
tế, đầu tháng 7 năm 2016, Bảo hiểm xã hội Việt Nam đã triển khai
việc cấp phát thẻ bảo hiểm y tế (BHYT) theo cấu trúc mã thẻ mới có
mã vạch 2 chiều cho tất cả các đối tượng tham gia BHYT, việc sử
dụng thẻ BHYT mã vạch 2 chiều đã mang lại nhiều tiện ích cho các
cơ sở khám chữa bệnh và người dân tham gia BHYT khi đi khám
chữa bệnh, đảm bảo sự chính xác thông tin trong việc cấp phát thẻ
BHYT cho bệnh nhân. Tuy nhiên trong quá trình triển khai còn gặp
nhiều những khó khăn như: việc đầu tư cơ sở vật chất chưa đồng bộ,
cần có lộ trình và kinh phí, trình độ tin học, công nghệ thông tin của
nhân viên ở các cơ sở khám chữa bệnh vẫn chưa theo kịp đà phát
triển của công nghệ…, một vấn đề khó khăn nữa là một số thẻ mới
phát hành đã bị mờ, mực in bị bong tróc, không rõ thông tin, máy
không đọc được mã vạch…gây khó khăn cho người dân lẫn các cơ sở
khám chữa bệnh, nhiều người ở xa đến, không khám bảo hiểm được
phải tự chi trả hoặc phải quay về xin cấp lại thẻ, mất thời gian, khó
khăn và tốn kém cho người bệnh.
Xuất phát từ thực tiễn trên, Tôi ứng dụng sức mạnh của công
2
nghệ thông tin trong lĩnh vực máy học để thực hiện đề tài “Nghiên
cứu phƣơng pháp nhận dạng chữ quang học và ứng dụng nhận
dạng thẻ bảo hiểm y tế”. Nhận dạng thẻ BHYT là một chương trình
hỗ trợ trong việc quản lý BHYT, từ kết quả nhận dạng mã số trên thẻ
BHYT nó giúp người quản lý tìm kiếm, trích xuất được thông tin về
bệnh nhân dựa trên thẻ BHYT một cách nhanh chóng, chính xác, hạn
chế tình trạng trùng thẻ BHYT, đảm bảo cho việc thanh toán BHYT
chính xác đạt hiệu quả cao, hạn chế tiêu cực, đồng thời theo dõi
xuyên suốt quá trình điều trị bệnh của bệnh nhân. Trong đề tài này,
Tôi sẽ nghiên cứu một số phương pháp nhận dạng trong lĩnh vực
nhận dạng chữ quang học. Từ đó, chúng ta sẽ có cách nhìn rõ nét hơn
về lĩnh vực máy học, hiểu được tầm quan trọng và tính thực tiễn của
nó trong cuộc sống con người.
2. MỤC TIÊU
- Nghiên cứu các phương pháp nhận dạng ảnh, nhận dạng ký
tự quang học và một số phương pháp trích chọn đặc trưng của ảnh.
- Xây dựng, cài đặt thuật toán nhận dạng để giải quyết bài toán
nhận dạng thẻ BHYT dựa trên việc thu thập số liệu, xây dựng cơ sở
tri thức và ứng dụng trong việc nhận dạng thẻ BHYT.
3. ĐỐI TƢỢNG VÀ PHẠM VI NGHIÊN CỨU
3.1. Đối tƣợng nghiên cứu
Các phương pháp nhận dạng ảnh, nhận dạng ký tự quang học.
3.2. Phạm vi nghiên cứu
- Ảnh thẻ BHYT.
- Ảnh chụp trong điều kiện ánh sáng bình thường (không chụp
ngược ánh sáng, chụp bằng máy kỹ thuật số hoặc máy scan).
- Các ký tự rời rạc, không bị dính.
3
4. PHƢƠNG PHÁP NGHIÊN CỨU
Để hoàn thành mục tiêu đề ra, tôi chọn phương pháp nghiên
cứu lý thuyết và tiến hành ứng dụng thực nghiệm. Cụ thể như sau:
- Về lý thuyết: Tham khảo các tài liệu lý thuyết liên quan.
- Về thực nghiệm:
+ Thu thập dữ liệu ảnh thẻ BHYT để xây dựng cơ sở tri thức.
+ Ứng dụng nhận dạng thẻ BHYT trên dữ liệu ảnh thu thập
được.
5. KẾT QUẢ DỰ KIẾN
5.1. Lý thuyết
- Nghiên cứu tổng quan về nhận dạng ảnh, nhận dạng ký tự
quang học.
- Nghiên cứu về lĩnh vực máy học, các phương pháp nhận
dạng: Phương phương pháp Máy vector hỗ trợ (Support Vector
Machine); Mạng nơ-ron nhân tạo (Artificial Neural Network),…để
làm cơ sở cho việc phân tích dữ liệu.
- Tìm hiểu về lập trình với OpenCV, Matlab.
5.2. Thực tiễn
Từ kết quả nhận dạng mã thẻ BHYT, dùng để hỗ trợ cho việc
quản lý thẻ BHYT trong khám chữa bệnh tại các cơ sở y tế.
6. BỐ CỤC LUẬN VĂN
Luận văn dự kiến tổ chức thành 3 chương chính như sau:
Chƣơng 1: TỔNG QUAN VỀ NHẬN DẠNG CHỮ
QUANG HỌC
Chƣơng 2: MẠNG NƠ-RON NHÂN TẠO
Chƣơng 3: ỨNG DỤNG NHẬN DẠNG THẺ BHYT
Cuối cùng là phần kết luận và hướng nghiên cứu phát triển của
luận văn.
4
CHƢƠNG 1
TỔNG QUAN VỀ NHẬN DẠNG CHỮ QUANG HỌC
Chương này giới thiệu khái quát về nhận dạng chữ quang học,
mô hình nhận dạng ký tự tổng quát, các khái niệm cơ bản về xử lý
ảnh và một số kỹ thuật, phương pháp nhận dạng chữ áp dụng trong
lĩnh vực nhận dạng.
Cho đến nay các kết quả nghiên cứu nhận dạng ở lĩnh vực này
vẫn còn hạn chế, các ứng dụng chủ yếu chỉ tập trung ở một số lĩnh
vực hẹp. Có nhiều mô hình, kỹ thuật tiên tiến trong lĩnh vực máy học
đang được áp dụng cho bài toán nhận dạng chữ như: mạng nơ-ron
nhân tạo, mô hình Markov ẩn, máy véc tơ hỗ trợ (SVM),...
CHƢƠNG 2
MẠNG NƠ-RON NHÂN TẠO
Chương này giới thiệu về mạng nơ-ron nhân tạo. Từ những đặc
trưng, tính năng của mạng nơ-ron nhân tạo là mạng có khả năng học
và là một hệ thống gồm nhiều phần tử xử lý đơn giản cùng hoạt động
xử lý song song, cho phép nó có thể được áp dụng để giải các bài
toán từ đơn giản đến phức tạp.
Đặc biệt là bài toán phân lớp, đây là loại bài toán này đòi hỏi
giải quyết vấn đề phân loại các đối tượng quan sát được thành các
nhóm dựa trên các đặc điểm của các nhóm đối tượng đó. Đồng thời là
dạng bài toán cơ sở của rất nhiều bài toán trong thực tế như: nhận
dạng chữ, tiếng nói, phân loại gen, phân loại chất lượng sản
phẩm,…Do đó, mạng nơ-ron perceptron một lớp là thuật toán được
lựa chọn để cài đặt ứng dụng trong việc nhận dạng thẻ.
5
CHƢƠNG 3
ỨNG DỤNG NHẬN DẠNG THẺ BHYT
Trong chương này, Tôi đưa một chương trình mô phỏng được
xây dựng và cài đặt dựa trên thuật toán mạng nơ-ron perceptron một
lớp truyền thẳng để huấn luyện, nhận dạng 18 chữ cái từ A đến Y và
10 chữ số từ 0 đến 9 và bộ dữ liệu mẫu gồm 200 file ảnh dùng để
kiểm thử hận dạng. Đây là các ký tự thường được dùng trong việc
cấp phát mã số trên thẻ BHYT dùng trong việc khám chữa bệnh tại
các cơ sở y tế. Dựa trên kết quả nhận dạng được từ chương trình,
người ta có thể dùng truy xuất dữ liệu và quản lý thẻ BHYT đạt hiệu
quả qua đó nâng cao hiệu suất trong quản lý và đồng thời theo dõi
xuyên suốt quá trình khám chữa bệnh cho bệnh nhân.
3.1. BÀI TOÁN NHẬN DẠNG THẺ BẢO HIỂM Y TẾ
Nhận dạng thẻ BHYT là một chương trình hỗ trợ trong hệ
thống quản lý BHYT, mô tả bài toán như sau:
- Đầu vào: Dữ liệu là các file ảnh dạng văn bản có định dạng
*.JPG trải qua các giai đoạn tiền xử lý: xử lý ảnh nhiễu, phân
ngưỡng, lọc ảnh..., phân tích ảnh và tách ký tự theo từng vùng sau đó
được huấn huyện dựa trên mạng nơ-ron nhân tạo và nhận dạng đưa ra
kết quả.
- Đầu ra: là một file text chứa các ký tự tương ứng với mã thẻ
BHYT mà chương trình mong muốn. Số ký tự đầu ra mong muốn
phải tương ứng với số ký tự ảnh đầu vào cần huấn luyện.
Dựa trên kết quả mã thẻ BHYT đã được nhận dạng, giúp
người quản lý có thể dùng để tìm kiếm, trích xuất được thông tin về
bệnh nhân một cách nhanh chóng, chính xác, hạn chế tình trạng trùng
6
thẻ BHYT, đảm bảo cho việc thanh toán BHYT chính xác đạt hiệu
quả cao, đồng thời có thể theo dõi xuyên suốt quá trình điều trị bệnh
của bệnh nhân.
3.2. CƠ SỞ DỮ LIỆU THỰC NGHIỆM
Tập dữ liệu mẫu dùng để huấn luyện chứa 28 file ảnh, với
kích thước 16×20, định dạng *.JPG, tương ứng với từng ký tự: gồm
các ký tự số từ 0 đến 9 và các ký tự chữ cái gồm A, B, C, D, E, G, H,
K, L, M, N, O, Q, S, T, V, X, Y.
A B C D X Y 0 1 2 3 5 8 9
Hình 3.1. Một số mẫu ký tự
Tập dữ liệu dùng để kiểm thử chứa: các file ảnh của thẻ
BHYT, định dạng *.JPG. Mỗi file ảnh được lưu với tên theo định
dạng:
<Mã thẻ BHYT>.JPG
Ví dụ: CH4480405300003.JPG
Hình 3.2. Mẫu thẻ BHYT dùng để kiểm thử
7
3.3. MÔ HÌNH NHẬN DẠNG THẺ BHYT
Hình 3.3. Mô hình nhận dạng thẻ BHYT
8
3.3.1. Thẻ BHYT
Hình 3.4. Thẻ bảo hiểm y tế
- Ô thứ nhất 02 ký tự: Gồm 2 chữ cái là mã đối tượng tham gia
BHYT gồm 34 loại đối tượng, có ký hiệu : DN, HX, CH, NN, TK,
HC, XK, CA, HT, TB, MS, XB, XN, TN, CC, CK, CB, KC, HD, BT,
HN, TC, TQ, TA, TY, TE, HG, LS, CN, HS, GD, TL, XV, NO.
- Ô thứ hai 01 ký tự: Được ký hiệu bằng số (theo thứ tự từ 1
đến 5), quy định mức hưởng BHYT.
- Ô thứ ba 02 ký tự: Được ký hiệu bằng số từ 01 đến 99 là mã
tỉnh, thành phố trực thuộc trung ương, nơi phát hành thẻ BHYT.
- Ô thứ tư 02 ký tự: Được ký hiệu bằng số từ 01 đến 99 là mã
quận, huyện, thị xã, thành phố trực thuộc tỉnh nơi quản lý đầu mối
của người tham gia BHYT.
- Ô thứ năm 03 ký tự: Được ký hiệu bằng số từ 001 đến 999 là
mã đơn vị quản lý, theo địa giới hành chính và theo loại đối tượng.
9
- Ô thứ sáu 05 ký tự: Được ký hiệu bằng số từ 00001 đến
99999 là số thứ tự của người tham gia BHYT trong 01 đơn vị.
3.3.2. Tiền xử lý
Giai đoạn này góp phần làm tăng độ chính xác phân lớp của hệ
thống nhận dạng, tuy nhiên nó cũng làm cho tốc độ nhận dạng của hệ
thống chậm lại. Vì vậy, tùy thuộc vào chất lượng ảnh quét vào để chọn
một hoặc một vài chức năng trong khối này. Nếu cần ưu tiên tốc độ xử
lý và chất lượng của máy quét tốt thì có thể bỏ qua giai đoạn này
Ảnh đầu vào sau khi được xử lý là một ảnh có 256 mức xám,
được tách nhiễu và phân ngưỡng và chỉ lấy những điểm trên ảnh có
màu lân cận đen, các điểm còn lại chuyển về màu trắng. Từ ảnh thu
được ta nhị phân hóa thành ảnh nhị phân. Mục đích của việc này là
làm nổi phần mã thẻ và thông tin trên thẻ. Sau đó, ảnh ta thu được là
ảnh chỉ chứa những thông tin về thẻ và ta tìm góc nghiêng của ảnh
(nếu có) và tiến hành quay ảnh bằng phép biến đổi Hough.
3.3.2.1. Phép quay ảnh
Ý tưởng của việc áp dụng biến đổi Hough đã nêu ở chương 1
trong việc tìm góc nghiêng văn bản là dùng một mảng tích luỹ để
đếm số điểm ảnh nằm trên một đường thẳng trong không gian ảnh.
Mảng tích luỹ là một mảng hai chiều với chỉ số hàng của mảng cho
biết góc lệch
của một đường thẳng và chỉ số cột chính là giá trị r
khoảng cách từ gốc toạ độ tới đường thẳng đó. Sau đó tính tổng số
điểm ảnh nằm trên những đường thẳng song song nhau theo các góc
lệch thay đổi. Góc nghiêng văn bản tương ứng với góc có tổng giá trị
mảng tích luỹ cực đại.
Ảnh đầu vào được giới hạn góc của ảnh trong phạm vi góc
thuộc khoảng [0:45] và ảnh không bị ngược.