Thư viện tri thức trực tuyến
Kho tài liệu với 50,000+ tài liệu học thuật
© 2023 Siêu thị PDF - Kho tài liệu học thuật hàng đầu Việt Nam

Nghiên cứu phương pháp mã hóa tiếng nói dùng kỹ thuật phân rã ma trận không âm
Nội dung xem thử
Mô tả chi tiết
i
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG
KHOA CÔNG NGHỆ THÔNG TIN
PHẠM MẠNH CƯỜNG
NGHIÊN CỨU PHƯƠNG PHÁP MÃ HÓA TIẾNG NÓI DÙNG
KỸ THUẬT PHÂN RÃ MA TRẬN KHÔNG ÂM
Chuyên ngành: Khoa học máy tính
Mã số: 848 01 01
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
NGƯỜI HƯỚNG DẪN KHOA HỌC
PGS. TS PHÙNG TRUNG NGHĨA
ii
LỜI CAM ĐOAN
Tên tôi là: Phạm Mạnh Cường
Sinh ngày: 31/10/1985
Học viên lớp cao học K17A - Trường Đại học Công nghệ thông tin và Truyền
thông - Thái Nguyên.
Tôi xin cam đoan, toàn bộ nội dung liên quan tới đề tài được trình bày trong
luận văn là bản thân tôi tìm hiều và nghiên cứu, dưới sự hướng dẫn khoa học của
Thầy giáo PGS.TS. Phùng Trung Nghĩa.
Các nội dung trong luận văn đúng như nội dung trong đề cương và yêu cầu
của thầy giáo hướng dẫn. Tất cả tài liệu tham khảo đều có nguồn gốc, xuất xứ rõ
ràng. Nếu sai tôi hoàn toàn chịu trách nhiệm trước hội đồng khoa học và trước
pháp luật.
Tác giả luận văn
Phạm Mạnh Cường
iii
LỜI CẢM ƠN
Sau một thời gian nghiên cứu và làm việc nghiêm túc, được sự động viên,
giúp đỡ và hướng dẫn tận tình của Thầy giáo hướng dẫn PGS.TS. Phùng Trung
Nghĩa, luận văn với đề tài “Nghiên cứu phương pháp mã hóa tiếng nói dùng kỹ
thuật phân rã ma trận không âm” đã hoàn thành.
Em xin bày tỏ lòng biết ơn sâu sắc đến: Thầy giáo hướng dẫn PGS.TS.
Phùng Trung Nghĩa đã tận tình chỉ dẫn, giúp đỡ em hoàn thành luận văn này.
Em xin cảm ơn Khoa sau Đại học Trường Đại học Công nghệ - Thông tin và
Truyền thông đã giúp đỡ em trong quá trình học tập cũng như thực hiện luận văn.
Em xin chân thành cảm ơn bạn bè, đồng nghiệp và gia đình đã động viên,
khích lệ, tạo điều kiện giúp đỡ em trong suốt quá trình học tập, thực hiện và hoàn
thành luận văn này.
Em xin chân thành cảm ơn!
Thái Nguyên, ngày tháng năm 2020
Học viên
Phạm Mạnh Cường
iv
MỤC LỤC
LỜI CAM ĐOAN .............................................................................................i
LỜI CẢM ƠN.................................................................................................iii
DANH MỤC CÁC BẢNG ............................................................................vii
DANH MỤC CÁC HÌNH............................................................................viii
Ý NGHĨA CÁC TỪ VIẾT TẮT....................................................................ix
MỞ ĐẦU .......................................................................................................... 2
1. Lý do chọn đề tài ............................................................................................2
2. Đối tượng và phạm vi nghiên cứu:.................................................................3
3. Hướng nghiên cứu của luận văn:....................................................................3
4. Phương pháp nghiên cứu................................................................................3
5. Ý nghĩa khoa học và thực tiễn........................................................................4
CHƯƠNG 1 TỔNG QUAN VỀ MÃ HÓA TIẾNG NÓI............................. 5
1.1. Tổng quan về tiếng nói................................................................................5
1.1.1. Thông tin tiếng nói.............................................................................5
1.1.2. Tín hiệu tiếng nói...............................................................................6
1.1.2.1. Tín hiệu ....................................................................................6
1.1.2.2. Nguồn tín hiệu..........................................................................7
1.1.2.3. Hệ thống và xử lý tín hiệu........................................................7
1.2.Tổng quan về mã hóa tiếng nói....................................................................8
1.3.Mã hóa tiếng nói tốc độ bit thấp ..................................................................9
1.4.Mục tiêu của luận văn................................................................................10
v
CHƯƠNG 2 PHƯƠNG PHÁP MÃ HÓA TIẾNG NÓI DÙNG KỸ THUẬT
PHÂN RÃ MA TRẬN KHÔNG ÂM NMF ................................................ 12
2.1. Tổng quan về kỹ thuật phân rã ma trận không âm NMF ..........................12
2.1.1. Khái niệm.........................................................................................12
2.1.2. Lịch sử .............................................................................................12
2.1.3. Nền tảng...........................................................................................12
2.1.4. Tích chất phân cụm..........................................................................14
2.2. Kỹ thuật phân rã ma trận không âm NMF và ứng dụng trong mã hóa tiếng
nói 15
2.2.1 Kỹ thuật phân rã ma trận không âm NMF........................................15
2.2.2 Ứng dụng trong mã hóa tiếng nói .....................................................21
2.3. Phương pháp mã hóa tiếng nói dùng NMF của Xue .................................22
2.4. Phương pháp mã hóa NMF của Chien ......................................................28
CHƯƠNG 3 ĐÁNH GIÁ THỰC NGHIỆM PHƯƠNG PHÁP MÃ HÓA
TIẾNG NÓI DÙNG KỸ THUẬT PHÂN RÃ MA TRẬN KHÔNG ÂM
NMF................................................................................................................ 36
3.1. Thu thập dữ liệu tiếng nói ........................................................................36
3.1.1. Ngữ âm tiếng Việt............................................................................36
3.1.1.1. Cấu trúc âm tiết tiếng Việt .....................................................36
3.1.1.2. Thanh điệu tiếng Việt.............................................................37
3.1.2. Cơ sở dữ liệu tiếng nói tiếng Việt ..........................................................38
3.1.2.1 Cơ sở dữ liệu tiếng nói phát thanh VOV.................................38
3.1.2.2 Cơ sở dữ liệu DEMEN567 ......................................................39
3.1.2.3 Cơ sở dữ liệu MICA VNSpeech .............................................39
3.1.3. Tổng hợp tiếng nói tiếng Việt.........................................................40
3.2. Cài đặt phương pháp mã hóa trên Matlab .................................................40