Thư viện tri thức trực tuyến
Kho tài liệu với 50,000+ tài liệu học thuật
© 2023 Siêu thị PDF - Kho tài liệu học thuật hàng đầu Việt Nam

Sử dụng kỹ thuật phân lớp dữ liệu để tính toán các bins màu động trong tra cứu ảnh dựa trên màu sắc
Nội dung xem thử
Mô tả chi tiết
Nguyễn Văn Tới và Đtg Tạp chí KHOA HỌC & CÔNG NGHỆ 90(02): 49 - 53
49
SỬ DỤNG KỸ THUẬT PHÂN LỚP DỮ LIỆU ĐỂ TÍNH TOÁN
CÁC BINS MÀU ĐỘNG TRONG TRA CỨU ẢNH DỰA TRÊN MÀU SẮC
Nguyễn Văn Tới*
, Phạm Việt Bình, Nguyễn Tiến Thành
ĐH Công nghệ Thông tin & Truyền thông – ĐH Thái Nguyên
TÓM TẮT
Kỹ thuật tra cứu dựa trên màu sắc là một trong những hƣớng tiếp cận cơ bản trong tra cứu ảnh.
Trong kỹ thuật này, ngƣời ta chia không gian màu ra thành các bins. Việc chia thành các bins màu
có kích thƣớc bằng nhau và cố định dẫn đến một số hạn chế trong việc tra cứu nhƣ không tính đến
tính tƣơng đồng giữa các màu khi phân các pixel vào các bins, vấn đề về tăng giảm độ sáng ảnh.
Bài báo này trình bày một cách tính toán các bins màu mềm dẻo sử dụng kỹ thuật phân lớp dữ liệu.
Chúng tôi đã thử nghiệm với thuật toán K-Means trên cơ sở dữ liệu ảnh MISC [4] và cơ sở dữ liệu
ảnh IFIT (Thƣ viện ảnh của Khoa Công nghệ thông tin-ĐH Thái Nguyên).
Từ khóa: Kỹ thuật phân lớp dữ liệu, bins màu động,thuật toán K-means
GIỚI THIỆU*
Cùng với sự phát triển nhanh chóng của công
nghệ phần cứng trong đó có các thiết bị thu
nhận ảnh, lƣu trữ dữ liệu, lƣợng dữ liệu ảnh
trong các lĩnh vực và trong đời sống ngày
càng gia tăng. Từ thực tế trên, nhu cầu lƣu
trữ, quản lý và tra cứu ảnh đƣợc đặt ra. Tra
cứu ảnh là việc tìm kiếm từ một cơ sở dữ liệu
(CSDL) ảnh ra một ảnh theo một yêu cầu nào
đó. Đã có nhiều hƣớng tiếp cận cho việc
nghiên cứu vấn đề này (xem [1]). Một trong
những hƣớng tiếp cận chính đó là tra cứu ảnh
dựa vào màu sắc. Kỹ thuật cơ sở tra cứu ảnh
dựa trên màu sắc sẽ đƣợc giới thiệu trong
phần 2. Các kỹ thuật cơ sở tra cứu ảnh dựa
trên màu sắc còn một số hạn chế. Những hạn
chế này đƣợc giới thiệu trong phần 3 cùng với
một số hƣớng tiếp cận khắc phục của một số
tác giả. Trong bài báo này, chúng tôi đƣa ra
một hƣớng khắc phục khác cho những hạn
chế của kỹ thuật cơ sở. Ý tƣởng của cách
khắc phục này là cải tiến việc tính toán các
bins màu bằng cách sử dụng kỹ thuật phân
lớp dữ liệu. Ý tƣởng này đƣợc trình bày trong
phần 4. Việc thực nghiệm với thuật toán phân
lớp dữ liệu K-Means và kết quả đƣợc trình
bày trong phần 5. Trong phần 6, chúng tôi
đƣa ra một số kết luận và hƣớng nghiên cứu
tiếp theo.
*
Tel: 0912847077; Email: [email protected]
KỸ THUẬT CƠ SỞ TRA CỨU ẢNH DỰA
TRÊN MÀU SẮC
Ý tƣởng của các kỹ thuật tra cứu ảnh trên cơ
sở màu là tra cứu từ CSDL ảnh những ảnh có
màu cảm nhận tƣơng tự ảnh truy vấn hay phù
hợp với mô tả của ngƣời sử dụng. Ngƣời ta đã
đề xuất một số kỹ thuật khác nhau nhƣng ý
tƣởng chủ đạo là nhƣ nhau. Mỗi ảnh trong
CSDL đƣợc biểu diễn bằng ba kênh của
không gian màu. Không gian màu hay sử
dụng nhất là RGB. Mỗi kênh màu đƣợc số
hóa thành m khoảng. Nhƣ vậy, tổng số tổ hợp
màu rời rạc (gọi là bins) sẽ là n = m3
. Thí dụ,
nếu mỗi kênh màu đƣợc số hóa thành 16
khoảng thì sẽ có 4096 bins. Biểu đồ màu
H(M) là véc tơ (h1, h2, ..., hj
, ..., hn), trong đó
phần tử hj biểu diễn tổng số pixel trong ảnh M
rơi vào bin j (j=1,..,n). Biểu đồ màu là véc tơ
đặc trƣng, sẽ đƣợc lƣu trữ làm chỉ mục ảnh.
Khi tra cứu ảnh, biểu đồ màu của ảnh truy
vấn đƣợc tính toán. Sau đó, tính toán khoảng
cách giữa biểu đồ màu của ảnh truy vấn và
từng biểu đồ màu của các ảnh trong CSDL
ảnh. Kết quả trình diễn cho ngƣời sử dụng là
k ảnh đầu tiên có khoảng cách nhỏ nhất.
Đã có nhiều độ đo khoảng cách biểu đồ màu
giữa hai ảnh I và H đƣợc đề xuất. Ví dụ nhƣ:
+ Độ đo L-1 (thuộc nhóm Minkowski-form
r=1):
n
l
l l d I J i j
1
( , ) .
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn