Thư viện tri thức trực tuyến
Kho tài liệu với 50,000+ tài liệu học thuật
© 2023 Siêu thị PDF - Kho tài liệu học thuật hàng đầu Việt Nam

Nhận dạng cử chỉ bàn tay ứng dụng trong điều khiển thiết bị điện gia dụng
Nội dung xem thử
Mô tả chi tiết
Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
Đại học Thái Nguyên
Trƣờng Đại học Công nghệ Thông tin và Truyền thông
LÊ MẠNH LINH
NHẬN DẠNG CỬ CHỈ BÀN TAY ỨNG DỤNG TRONG
ĐIỀU KHIỂN THIẾT BỊ ĐIỆN GIA DỤNG
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
Thái Nguyên - năm 2015
2
Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
Đại học Thái Nguyên
Trƣờng đại học Công nghệ Thông tin và Truyền thông
LÊ MẠNH LINH
[
NHẬN DẠNG CỬ CHỈ BÀN TAY ỨNG DỤNG TRONG
ĐIỀU KHIỂN THIẾT BỊ ĐIỆN GIA DỤNG
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
Chuyên ngành: KHOA HỌC MÁY TÍNH
Mã số: 60 48 01 01
Ngƣời hƣớng dẫn khoa học: TS. PHẠM ĐỨC LONG
Thái Nguyên - năm 2015
3
Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
LỜI CẢM ƠN
Em xin chân thành cảm ơn Trƣờng Đại học Công nghệ Thông tin và Truyền
thông – Đại học Thái Nguyên đã tạo điều kiện cho em thực hiện luận văn này.
Em xin gửi lời cảm ơn sâu sắc tới thầy giáo TS Phạm Đức Long, trƣởng
khoa Tự động hóa – Trƣờng Đại học Công nghệ Thông tin và Truyền thông – Đại
học Thái Nguyên đã trực tiếp hƣớng dẫn em trong suốt quá trình thực hiện luận văn.
Em cũng xin gửi lời cảm ơn tới các thầy, cô, đã có những ý kiến đóng góp
bổ ích và đã tạo mọi điều kiện tốt nhất cho em trong suốt thời gian thực tập và thực
hiện luận văn. Xin cảm ơn các bạn học đồng khóa đã thƣờng xuyên động viên, giúp
đỡ tôi trong quá trình học tập.
Cuối cùng, em xin gửi lời cảm ơn đến gia đình và bạn bè vì những tình cảm,
sự ủng hộ và động viên đã dành cho em trong suốt quá trình học tập cũng nhƣ thực
hiện luận văn này.
Thái Nguyên, tháng 09 năm 2015
Học viên
Lê Mạnh Linh
4
Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
LỜI CAM ĐOAN
Em xin cam đoan về nội dung đồ án tốt nghiệp với tên đề tài “Nhận dạng
cử chỉ bàn tay ứng dụng trong điều khiển thiết bị điện gia dụng” không sao
chép nội dung cơ bản từ các luận văn khác, hay các sản phẩm tƣơng tự mà không
phải do em làm ra. Sản phẩm của luận văn là do chính bản thân em nghiên cứu và
xây dựng nên.
Nếu có gì sai em xin chịu mọi hình thức kỷ luật của Trƣờng Đại học Công
nghệ Thông tin và Truyền thông – Đại học Thái Nguyên.
Thái Nguyên, tháng 09 năm 2015
Học viên
Lê Mạnh Linh
5
Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
MỤC LỤC
DANH MỤC CÁC HÌNH VẼ..................................................................................... 7
DANH MỤC CÁC BẢNG BIỂU ............................................................................... 8
CHƢƠNG I: TỔNG QUAN VỀ NHẬN DẠNG CỬ CHỈ........................................ 9
1.1. Khái niệm về nhận dạng cử chỉ ................................................................... 10
1.2. Phân loại cử chỉ: .......................................................................................... 10
1.3. Mô hình bài toán nhận dạng cử chỉ: ............................................................ 11
1.4. Một số đặc trƣng sử dụng biểu diễn cử chỉ bàn tay:.................................... 13
1.4.1. Đặc trƣng các thành phần chính PCA:.................................................. 13
1.4.2. Đặc trƣng HOG..................................................................................... 15
1.4.3. Đặc trƣng SIFT ..................................................................................... 15
1.4.4. Đặc trƣng Haar like............................................................................... 19
CHƢƠNG II: CÁC KỸ THUẬT NHẬN DẠNG CỬ CHỈ BÀN TAY TRONG
VIDEO ...................................................................................................................... 23
2.1. Kỹ thuật sử dụng mạng nơron ..................................................................... 23
2.2. Kỹ thuật SVM (Suport Vector Machine) .................................................... 25
2.3. Kỹ thuật sử dụng Boosting và mô hình Cascade......................................... 31
2.3.1. Tiếp cận Boosting ................................................................................. 31
2.3.2. AdaBoost .............................................................................................. 32
2.3.3 Thuật toán AdaBoost trong mô hình Cascade sử dụng Boosting cho bộ
nhận dạng cử chỉ:................................................................................................ 35
2.3.4. Mô hình Cascade .................................................................................. 39
CHƢƠNG III: NHẬN DẠNG CỬ CHỈ BÀN TAY ỨNG DỤNG TRONG ĐIỀU
KHIỂN THIẾT BỊ ĐIỆN GIA DỤNG ..................................................................... 48
3.1. Bài toán nhận dạng cử chỉ bàn tay ứng dụng trong điều khiển thiết bị điện
gia dụng: ................................................................................................................ 48
Một số tập cử chỉ tay đã tồn tại .......................................................................... 54
Tập cử chỉ đề xuất: ............................................................................................. 57
Xây dựng cơ sở dữ liệu và thử nghiệm .............................................................. 59
6
Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
Xây dựng tập ảnh positive.................................................................................. 60
Xây dựng tập dữ liệu ảnh negative..................................................................... 63
Xây dựng tập dữ liệu ảnh thử nghiệm................................................................ 63
Xây dựng chƣơng trình ứng dụng ...................................................................... 64
3.2. Cài đặt hệ thống điều khiển thiết bị điện gia dụng bằng cử chỉ bàn tay thông
qua camera kỹ thuật số .......................................................................................... 65
KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN CỦA ĐỀ TÀI......................................... 67
TÀI LIỆU THAM KHẢO......................................................................................... 69
7
Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
DANH MỤC CÁC HÌNH VẼ
Hình 1. 1 - Sơ đồ tổng quát của bài toán nhận dạng cử chỉ ...................................... 11
Hình 1. 2 - 10 vector đặc trƣng có ý nghĩa và 5 vector không mang thông tin ........ 14
Hình 1. 3 - Ảnh sau khi tính gradient chia thành các cell......................................... 15
Hình 1. 4 - Đặc trƣng SIFT biểu diễn các điểm đặc biệt trong ảnh .......................... 16
Hình 1. 5 - Xác định điểm cực trị trong không gian tỉ lệ .......................................... 17
Hình 1. 6a,b,c - Các đặc trƣng đƣờng ....................................................................... 20
Hình 1. 7 Đặc trƣng Haar cho bàn tay ...................................................................... 21
Hình 1. 8 - Cách tính tổng các điểm ảnh trong một hình chữ nhật bất kì................. 21
Hình 2. 1 - Mô hình mạng nơron theo Rowley ........................................................ 24
Hình 2. 2 - Ánh xạ dữ liệu từ không gian gốc sang không gian đặc trƣng cho phép
phân chia dữ liệu bởi siêu phẳng............................................................................... 26
Hình 2. 3 - Siêu phẳng tách với khoảng cách lề cực đại........................................... 27
Hình 2. 4 - Support Vectors ...................................................................................... 30
Hình 2. 5 - Minh họa Support Vectors...................................................................... 30
Hình 2. 6 - Minh họa Boosting.................................................................................. 32
Hình 2. 7 - Minh họa thuật toán AdaBoost............................................................... 33
Hình 2. 8 - Bộ phân loại mạnh H(x) xây dựng bằng AdaBoost................................ 34
Hình 2. 9 - Bộ phân lớp CBC.................................................................................... 35
Hình 2. 10 - Cách chọn bộ phân loại yếu của AdaBoost .......................................... 37
Hình 2. 11 - Các ngƣỡng θ ........................................................................................ 38
Hình 2. 12 - Mô hình Cascade .................................................................................. 39
Hình 2. 13 - Các vùng không liên quan sẽ bị loại ngay từ những tầng đầu tiên....... 46
Hình 2. 14 - Khắc phục trƣờng hợp nhiều vùng ảnh kế cận nhau bằng cách lấy vùng
ảnh trung bình ........................................................................................................... 46
Hình 2. 15 - Vùng ảnh lồng nhau.............................................................................. 47
Hình 3. 1 - Sơ đồ khối của hệ thống ......................................................................... 48
Hình 3. 2 - Khối nhận dạng cử chỉ............................................................................ 49
Hình 3. 3 - Sơ đồ nguyên lý hoạt động của khối điều khiển thiết bị ........................ 50
Hình 3. 4 - Sơ đồ thiết kế phần nhận tín hiệu điều khiển từ cổng COM của máy tính
và phát sóng RF......................................................................................................... 51
Hình 3. 5 - Sơ đồ thiết kế bộ thu tín hiệu và điều khiển thiết bị............................... 52
Hình 3. 6 - Quy trình thiết kế cử chỉ ......................................................................... 53
Hình 3. 7 - Ảnh chụp bằng webcam cho các cử chỉ.................................................. 60