Siêu thị PDFTải ngay đi em, trời tối mất

Thư viện tri thức trực tuyến

Kho tài liệu với 50,000+ tài liệu học thuật

© 2023 Siêu thị PDF - Kho tài liệu học thuật hàng đầu Việt Nam

Tìm hiểu phương pháp tra cứu ảnh theo nội dung
PREMIUM
Số trang
71
Kích thước
1.0 MB
Định dạng
PDF
Lượt xem
1163

Tìm hiểu phương pháp tra cứu ảnh theo nội dung

Nội dung xem thử

Mô tả chi tiết

§¹i häc Th¸i Nguyªn

Khoa c«ng nghÖ th«ng tin

Lª Hång Phong

T×m hiÓu ph-¬ng ph¸p tra cøu ¶nh

theo néi dung

LuËn v¨n th¹c sÜ c«ng nghÖ th«ng tin

Th¸i Nguyªn - 2010

§¹i häc Th¸i Nguyªn

Khoa c«ng nghÖ th«ng tin

Lª Hång Phong

T×m hiÓu ph-¬ng ph¸p tra cøu ¶nh

theo néi dung

Chuyªn ngµnh : Khoa häc m¸y tÝnh

M· sè : 60.48.01

LuËn v¨n th¹c sÜ c«ng nghÖ th«ng tin

Ng-êi h-íng dÉn khoa häc

PGS.TS Ng« Quèc T¹o

Th¸i Nguyªn - 2010

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

LỜI CAM ĐOAN

Tôi xin cam đoan toàn bộ nội dung bản luận văn theo đúng nội dung đề

cương cũng như nội dung mà cán bộ hướng dẫn giao cho. Nội dung luận văn này là

do tôi tự sưu tầm, tra cứu và sắp xếp cho phù hợp với nội dung yêu cầu của đề tài.

Nội dung luận văn này chưa từng được công bố hay xuất bản dưới bất kỳ

hình thức nào và cũng không được sao chép từ bất kỳ một công trình nghiên cứu

nào.

Tất cả phần mã nguồn của chương trình đều do tôi tự thiết kế và xây dựng,

trong đó có sử dụng một số thư viện chuẩn và các thuật toán được các tác giả xuất

bản công khai và miễn phí trên mạng Internet.

Nếu sai tôi xin tôi xin hoàn toàn chịu trách nhiệm.

Thái Nguyên, tháng 10 năm 2010

Người cam đoan

Lê Hồng Phong

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

DANH MỤC CÁC CHỮ VIẾT TẮT

Chữ

viết tắt Dạng đầy đủ Nghĩa tiếng Việt

PWT

Pyramid-structured Wavelet

Transform

Biến đổi dạng sóng kiểu hình

chóp

TWT

Tree-structure Wavelet Transform Biến đổi dạng sóng kiểu hình

cây

SAR Simultaneous Auto Regressive Tự thoái lui đồng thời

MRF Markov Random Field Trƣờng ngẫu nhiên Markov

DC Direct Current Thành phần một chiều

AVR Average Rank Thứ hạng trung bình

MRR Modified Retrieval Rank Thứ hạng tra cứu sửa đổi

ANMRR

Average Normalized Modified

Retrieval Rank

Thứ hạng tra cứu sửa đổi và

chuẩn hoá trung bình

GCH Global Color Histogram Biểu đồ màu toàn cục

LCH Local Color Histogram Biểu đồ màu cục bộ

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

1

MỞ ĐẦU

Những năm gần đây, ảnh số ngày càng thu hút đƣợc sự quan tâm của nhiều

ngƣời, một phần là do các thiết bị thu nhận ảnh số ngày càng phổ biến và có giá cả

phù hợp, cho phép nhiều ngƣời có thể sở hữu và sử dụng. Mặt khác các công nghệ

chế tạo thiết bị lƣu trữ luôn đƣợc cải tiến để cho ra đời các thiết bị lƣu trữ có dung

lƣợng lớn và giá thành hạ làm cho việc lƣu trữ ảnh dƣới dạng các file trở nên phổ

biến. Thêm nữa là sự phát triển của mạng Internet làm cho số lƣợng ảnh số đƣợc

đƣa lên lƣu trữ và trao đổi qua Internet là rất lớn.

Tuy nhiên khi số lƣợng ảnh đƣợc lƣu trữ trở nên rất lớn thì vấn đề là phải có

những phƣơng pháp tổ chức cơ sở dữ liệu ảnh tốt cùng với những kỹ thuật tìm

kiếm, tra cứu ảnh hiệu quả, có độ chính xác cao và có hiệu năng tốt.

Việc tìm kiếm đƣợc một bức ảnh mong muốn trong hàng triệu bức ảnh thuộc

đủ loại chủ đề khác nhau là rất khó khăn.

Khi số lƣợng ảnh trong một bộ sƣu tập còn ít, việc nhận diện một bức ảnh

hay việc so sánh sự giống và khác nhau giữa nhiều bức ảnh có thể thực hiện đƣợc

bằng mắt thƣờng, tuy nhiên khi có số lƣợng rất lớn ảnh thì việc so sánh bằng mắt

thƣờng là rất khó khăn, đòi hỏi phải có những phƣơng pháp hiệu quả và chính xác

hơn.

Trong thực tế, bài toán tra cứu ảnh số có rất nhiều ứng dụng quan trọng. Ví

dụ nhƣ trong lĩnh vực ngân hàng việc so sánh chữ ký của khách hàng với mẫu chữ

ký đã đƣợc lƣu trữ sẵn có thể thực hiện rất nhanh và chính xác nếu có đƣợc một

phần mềm so sánh mẫu chữ ký tốt. Thực tế hiện nay tại các ngân hàng ở Việt nam

ngƣời ta vẫn phải sử dụng phƣơng pháp so sánh bằng mắt thƣờng vì việc so sánh

chữ ký bằng phần mềm vẫn chƣa thực hiện đƣợc. Một ví dụ khác là bài toán quản lý

biểu trƣng (logo) trong lĩnh vực sở hữu trí tuệ. Khi một đơn vị muốn đăng ký logo

riêng cho đơn vị của mình thì cơ quan quản lý phải tiến hành đánh giá xem mẫu

logo đó đã đƣợc sử dụng hay chƣa hoặc có tƣơng tự với mẫu logo nào đó đang đƣợc

sử dụng hay không. Trong trƣờng hợp này nếu sử dụng mắt thƣờng để duyệt thì sẽ

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

2

tốn rất nhiều thời gian, nếu có các phần mềm cho phép tìm kiếm trong cơ sở dữ liệu

ảnh có sẵn những biểu trƣng tƣơng tự với biểu trƣng mẫu thì việc đánh giá sự tƣơng

tự sẽ dễ dàng hơn nhiều.

Các ứng dụng phức tạp hơn nhƣ so sánh mẫu vân tay, tìm kiếm ảnh tội phạm

v.v... là những bài toán tra cứu ảnh đƣợc áp dụng trong ngành khoa học hình sự.

Vì vậy, việc xây dựng các hệ thống tìm kiếm và xếp hạng ảnh là rất cần

thiết và thực tế đã có nhiều công cụ tìm kiếm ảnh thƣơng mại xuất hiện. Các công

cụ tìm kiếm ảnh thƣờng dựa vào hai đặc trƣng chính là văn bản đi kèm ảnh hoặc nội

dung ảnh.

Trƣớc năm 1990, ngƣời ta thƣờng sử dụng phƣơng pháp tra cứu ảnh theo văn

bản (Text Based Image Retrieval). Theo cách này ngƣời ta sẽ gán cho mỗi bức ảnh

một lời chú thích phù hợp với nội dung hoặc một đặc điểm nào đó của ảnh, sau đó

việc tra cứu ảnh đƣợc thực hiện dựa trên những lời chú thích này. Phƣơng pháp này

khá đơn giản. Tuy nhiên, việc tìm kiếm chỉ dựa vào văn bản đi kèm còn có nhiều

nhập nhằng giữa nội dung hiển thị ảnh và nội dung văn bản đi kèm ảnh trong quá

trình tìm kiếm. Ví dụ, với truy vấn “Apple”, máy tìm kiếm khó phân biệt đƣợc

ngƣời dùng muốn tìm hình ảnh quả táo hay logo của hãng Apple. Bên cạnh đó

phƣơng pháp tra cứu ảnh dựa theo văn bản không thể áp dụng để tra cứu các cơ sở

dữ liệu ảnh có số lƣợng ảnh lớn và kết quả tra cứu thì mang tính chủ quan và cảm

ngữ cảnh. Một số công cụ tìm kiếm ảnh theo văn bản đi kèm nhƣ: google Image

Search, Yahoo!, MSN,…

Một trong những phƣơng pháp đƣợc nhiều ngƣời quan tâm nghiên cứu hiện

nay là phƣơng pháp “Tra cứu ảnh dựa theo nội dung” (Content Based Image

Retrieval). Ý tƣởng phƣơng pháp này là trích chọn các đặc điểm dựa vào nội dung

trực quan của ảnh nhƣ màu sắc, kết cấu, hình dạng và bố cục không gian của ảnh

để làm cơ sở cho việc tra cứu, sắp xếp, tổ chức cơ sở dữ liệu ảnh. Một số hệ thống

tra cứu ảnh nổi tiếng nhƣ QBIC (IBM), Virage (Virage Inc.), Photobook (MIT),

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

3

VisualSEEK (Columbia University)... đã áp dụng khá thành công phƣơng pháp tra

cứu này. [7],[16],[17]

Nội dung của đề tài này giới thiệu cơ sở lý thuyết và các ứng dụng chính của

một số phƣơng pháp tra cứu ảnh, trong đó đi sâu vào giới thiệu phƣơng pháp tra cứu

ảnh theo nội dung. Trên những cơ sở đó tiến hành thử nghiệm một phƣơng pháp cụ

thể để xây dựng một chƣơng trình phần mềm tra cứu ảnh cho phép đọc vào một ảnh

mẫu và tìm kiếm những ảnh tƣơng tự với ảnh mẫu trong một tập hợp các ảnh cho

trƣớc theo hai đặc điểm là hình dạng và màu sắc của ảnh.

Nội dung luận văn ngoài phần mở đầu gồm có ba chƣơng:

Chương 1: Trình bày tổng quan vấn đề tra cứu ảnh, giới thiệu sơ lƣợc một số

phƣơng pháp tra cứu ảnh và một số hệ thống tra cứu ảnh tiêu biểu.

Chương 2: Giới thiệu chi tiết về một số phƣơng pháp trích chọn đặc trƣng

ảnh.

Chương 3: Giới thiệu một ứng dụng của phƣơng pháp tra cứu ảnh theo nội

dung; những hạn chế và khả năng mở rộng của chƣơng trình ứng dụng đó.

Tải ngay đi em, còn do dự, trời tối mất!