Thư viện tri thức trực tuyến
Kho tài liệu với 50,000+ tài liệu học thuật
© 2023 Siêu thị PDF - Kho tài liệu học thuật hàng đầu Việt Nam

Nhận dạng các đối tượng cơ bản trong tài liệu ảnh bằng toán tử hợp vùng
Nội dung xem thử
Mô tả chi tiết
T¹p chÝ Khoa häc & C«ng nghÖ - Sè 2(46) Tập 1/N¨m 2008
95
nhËn d¹ng c¸c ®èi t−îng c¬ b¶n trong tµi liÖu ¶nh b»ng to¸n tö hîp vïng
Từ Trung Hiếu (Tr−êng §¹i häc Thñy lîi)
1. Giới thiệu
Vùng cơ sở (basis area) là các vùng tương đối nhỏ, thông thường 3x3, có kích thước
bằng nhau, được dùng để tổng hợp thành các vùng lớn hơn. Các vùng cơ sở có thể được tạo dễ
dàng bằng các vòng lặp for trong lập trình. Các vùng cơ sở có thể được tạo giao nhau để đảm
bảo việc tìm các vùng liên thông chính xác hơn.
Toán tử hợp vùng (merge operator) có đầu vào là các vùng cần ghép và đầu ra là các
vùng mới được tạo ra bằng cách ghép các vùng đầu vào kề nhau. Hai vùng gọi là kề nhau theo
nghĩa đơn giản nhất là hình chữ nhật bao của chúng giao nhau. Trong bài báo này, chúng tôi sẽ
định nghĩa các toán tử liền kề khác nhau.
S = tập tất cả các vùng cần ghép;
do {
changes = false; T = ∅;
while( S ≠ ∅ ) {
a = remove(S);
for(b ∈ S) if( adjacentAreas(a, b) ) { b=remove(S); a=mergeAreas(a, b); changes=true; }
T = add(T, a);
}
S = T;
} while( changes );
S chính là các vùng đã được tạo ra từ các vùng đầu vào
Để phù hợp cho việc nhận dạng các đối tượng khác nhau. Chúng tôi định nghĩa một số
các vùng cơ sở khác nhau. Dạng hay dùng nhất là các ô vuông nhỏ (basis cell) bằng nhau,
thường được tạo ra bằng các vòng lặp. Tia dọc cơ sở (basis v-ray) là một vùng cơ sở kéo dài từ
mép trên xuống mép dưới của ảnh. Tia ngang cơ sở (basis h-ray) là một vùng cơ sở kéo dài từ
trái sang phải của ảnh. Đoạn dọc cơ sở (basis v-line) là một đoạn dọc ngắn trong ảnh song song
với mép dọc của ảnh. Đoạn ngang cơ sở (basis h-line) là một đoạn ngang ngắn song song với
mép ngang của ảnh. Các tia khác các đoạn ở chỗ chúng kéo dài từ mép này tới mép kia của ảnh.
Các đoạn dọc và đoạn ngang cơ sở có tác dụng nhận dạng các đối tượng song song hoặc gần
song song với các mép ảnh, ví dụ các dòng văn bản, các viền của bảng dữ liệu.
Việc tách vùng (split) và ghép vùng (merge) là hai toán tử cơ bản trong nhận dạng các
vùng của ảnh. Giống như các phép dịch (shift) và rút gọn (reduce) của các bộ phân tích cú pháp
từ dưới lên. Các toán tử adjacentAreas và mergeAreas sẽ được tổng quát hóa để giải quyết
việc nhận dạng các vùng khác nhau trong các phần tiếp theo.
2. Nhận dạng các vùng độc lập trong ảnh
Vùng liền kề (adjacent area) là vùng được tạo bởi các phần tử mang năng lượng hay
mang các điểm ảnh nội dung ghép lại với nhau. Các vùng liền kề sẽ tạo ra các phần tương đối
độc lập trong ảnh. Việc nhận dạng các vùng liền kề rất quan trọng trong phân tích tài liệu ảnh, vì
chúng cho phép tách ảnh ra thành các phần độc lập và được xử lý riêng biệt với các phần khác
của ảnh. Thông thường các vùng liền kề có thể là các vùng bao bởi hình chữ nhật, hoặc các
đường định hướng.