Siêu thị PDFTải ngay đi em, trời tối mất

Thư viện tri thức trực tuyến

Kho tài liệu với 50,000+ tài liệu học thuật

© 2023 Siêu thị PDF - Kho tài liệu học thuật hàng đầu Việt Nam

Nhận dạng các đối tượng cơ bản trong tài liệu ảnh bằng toán tử hợp vùng
MIỄN PHÍ
Số trang
6
Kích thước
283.2 KB
Định dạng
PDF
Lượt xem
1894

Nhận dạng các đối tượng cơ bản trong tài liệu ảnh bằng toán tử hợp vùng

Nội dung xem thử

Mô tả chi tiết

T¹p chÝ Khoa häc & C«ng nghÖ - Sè 2(46) Tập 1/N¨m 2008

95

nhËn d¹ng c¸c ®èi t−îng c¬ b¶n trong tµi liÖu ¶nh b»ng to¸n tö hîp vïng

Từ Trung Hiếu (Tr−êng §¹i häc Thñy lîi)

1. Giới thiệu

Vùng cơ sở (basis area) là các vùng tương đối nhỏ, thông thường 3x3, có kích thước

bằng nhau, được dùng để tổng hợp thành các vùng lớn hơn. Các vùng cơ sở có thể được tạo dễ

dàng bằng các vòng lặp for trong lập trình. Các vùng cơ sở có thể được tạo giao nhau để đảm

bảo việc tìm các vùng liên thông chính xác hơn.

Toán tử hợp vùng (merge operator) có đầu vào là các vùng cần ghép và đầu ra là các

vùng mới được tạo ra bằng cách ghép các vùng đầu vào kề nhau. Hai vùng gọi là kề nhau theo

nghĩa đơn giản nhất là hình chữ nhật bao của chúng giao nhau. Trong bài báo này, chúng tôi sẽ

định nghĩa các toán tử liền kề khác nhau.

S = tập tất cả các vùng cần ghép;

do {

changes = false; T = ∅;

while( S ≠ ∅ ) {

a = remove(S);

for(b ∈ S) if( adjacentAreas(a, b) ) { b=remove(S); a=mergeAreas(a, b); changes=true; }

T = add(T, a);

}

S = T;

} while( changes );

S chính là các vùng đã được tạo ra từ các vùng đầu vào

Để phù hợp cho việc nhận dạng các đối tượng khác nhau. Chúng tôi định nghĩa một số

các vùng cơ sở khác nhau. Dạng hay dùng nhất là các ô vuông nhỏ (basis cell) bằng nhau,

thường được tạo ra bằng các vòng lặp. Tia dọc cơ sở (basis v-ray) là một vùng cơ sở kéo dài từ

mép trên xuống mép dưới của ảnh. Tia ngang cơ sở (basis h-ray) là một vùng cơ sở kéo dài từ

trái sang phải của ảnh. Đoạn dọc cơ sở (basis v-line) là một đoạn dọc ngắn trong ảnh song song

với mép dọc của ảnh. Đoạn ngang cơ sở (basis h-line) là một đoạn ngang ngắn song song với

mép ngang của ảnh. Các tia khác các đoạn ở chỗ chúng kéo dài từ mép này tới mép kia của ảnh.

Các đoạn dọc và đoạn ngang cơ sở có tác dụng nhận dạng các đối tượng song song hoặc gần

song song với các mép ảnh, ví dụ các dòng văn bản, các viền của bảng dữ liệu.

Việc tách vùng (split) và ghép vùng (merge) là hai toán tử cơ bản trong nhận dạng các

vùng của ảnh. Giống như các phép dịch (shift) và rút gọn (reduce) của các bộ phân tích cú pháp

từ dưới lên. Các toán tử adjacentAreas và mergeAreas sẽ được tổng quát hóa để giải quyết

việc nhận dạng các vùng khác nhau trong các phần tiếp theo.

2. Nhận dạng các vùng độc lập trong ảnh

Vùng liền kề (adjacent area) là vùng được tạo bởi các phần tử mang năng lượng hay

mang các điểm ảnh nội dung ghép lại với nhau. Các vùng liền kề sẽ tạo ra các phần tương đối

độc lập trong ảnh. Việc nhận dạng các vùng liền kề rất quan trọng trong phân tích tài liệu ảnh, vì

chúng cho phép tách ảnh ra thành các phần độc lập và được xử lý riêng biệt với các phần khác

của ảnh. Thông thường các vùng liền kề có thể là các vùng bao bởi hình chữ nhật, hoặc các

đường định hướng.

Tải ngay đi em, còn do dự, trời tối mất!