Siêu thị PDFTải ngay đi em, trời tối mất

Thư viện tri thức trực tuyến

Kho tài liệu với 50,000+ tài liệu học thuật

© 2023 Siêu thị PDF - Kho tài liệu học thuật hàng đầu Việt Nam

Nghiên cứu phương pháp mã hóa tiếng nói dùng kỹ thuật phân rã ma trận không âm
PREMIUM
Số trang
59
Kích thước
1.8 MB
Định dạng
PDF
Lượt xem
1974

Nghiên cứu phương pháp mã hóa tiếng nói dùng kỹ thuật phân rã ma trận không âm

Nội dung xem thử

Mô tả chi tiết

i

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG

KHOA CÔNG NGHỆ THÔNG TIN

PHẠM MẠNH CƯỜNG

NGHIÊN CỨU PHƯƠNG PHÁP MÃ HÓA TIẾNG NÓI DÙNG

KỸ THUẬT PHÂN RÃ MA TRẬN KHÔNG ÂM

Chuyên ngành: Khoa học máy tính

Mã số: 848 01 01

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

NGƯỜI HƯỚNG DẪN KHOA HỌC

PGS. TS PHÙNG TRUNG NGHĨA

ii

LỜI CAM ĐOAN

Tên tôi là: Phạm Mạnh Cường

Sinh ngày: 31/10/1985

Học viên lớp cao học K17A - Trường Đại học Công nghệ thông tin và Truyền

thông - Thái Nguyên.

Tôi xin cam đoan, toàn bộ nội dung liên quan tới đề tài được trình bày trong

luận văn là bản thân tôi tìm hiều và nghiên cứu, dưới sự hướng dẫn khoa học của

Thầy giáo PGS.TS. Phùng Trung Nghĩa.

Các nội dung trong luận văn đúng như nội dung trong đề cương và yêu cầu

của thầy giáo hướng dẫn. Tất cả tài liệu tham khảo đều có nguồn gốc, xuất xứ rõ

ràng. Nếu sai tôi hoàn toàn chịu trách nhiệm trước hội đồng khoa học và trước

pháp luật.

Tác giả luận văn

Phạm Mạnh Cường

iii

LỜI CẢM ƠN

Sau một thời gian nghiên cứu và làm việc nghiêm túc, được sự động viên,

giúp đỡ và hướng dẫn tận tình của Thầy giáo hướng dẫn PGS.TS. Phùng Trung

Nghĩa, luận văn với đề tài “Nghiên cứu phương pháp mã hóa tiếng nói dùng kỹ

thuật phân rã ma trận không âm” đã hoàn thành.

Em xin bày tỏ lòng biết ơn sâu sắc đến: Thầy giáo hướng dẫn PGS.TS.

Phùng Trung Nghĩa đã tận tình chỉ dẫn, giúp đỡ em hoàn thành luận văn này.

Em xin cảm ơn Khoa sau Đại học Trường Đại học Công nghệ - Thông tin và

Truyền thông đã giúp đỡ em trong quá trình học tập cũng như thực hiện luận văn.

Em xin chân thành cảm ơn bạn bè, đồng nghiệp và gia đình đã động viên,

khích lệ, tạo điều kiện giúp đỡ em trong suốt quá trình học tập, thực hiện và hoàn

thành luận văn này.

Em xin chân thành cảm ơn!

Thái Nguyên, ngày tháng năm 2020

Học viên

Phạm Mạnh Cường

iv

MỤC LỤC

LỜI CAM ĐOAN .............................................................................................i

LỜI CẢM ƠN.................................................................................................iii

DANH MỤC CÁC BẢNG ............................................................................vii

DANH MỤC CÁC HÌNH............................................................................viii

Ý NGHĨA CÁC TỪ VIẾT TẮT....................................................................ix

MỞ ĐẦU .......................................................................................................... 2

1. Lý do chọn đề tài ............................................................................................2

2. Đối tượng và phạm vi nghiên cứu:.................................................................3

3. Hướng nghiên cứu của luận văn:....................................................................3

4. Phương pháp nghiên cứu................................................................................3

5. Ý nghĩa khoa học và thực tiễn........................................................................4

CHƯƠNG 1 TỔNG QUAN VỀ MÃ HÓA TIẾNG NÓI............................. 5

1.1. Tổng quan về tiếng nói................................................................................5

1.1.1. Thông tin tiếng nói.............................................................................5

1.1.2. Tín hiệu tiếng nói...............................................................................6

1.1.2.1. Tín hiệu ....................................................................................6

1.1.2.2. Nguồn tín hiệu..........................................................................7

1.1.2.3. Hệ thống và xử lý tín hiệu........................................................7

1.2.Tổng quan về mã hóa tiếng nói....................................................................8

1.3.Mã hóa tiếng nói tốc độ bit thấp ..................................................................9

1.4.Mục tiêu của luận văn................................................................................10

v

CHƯƠNG 2 PHƯƠNG PHÁP MÃ HÓA TIẾNG NÓI DÙNG KỸ THUẬT

PHÂN RÃ MA TRẬN KHÔNG ÂM NMF ................................................ 12

2.1. Tổng quan về kỹ thuật phân rã ma trận không âm NMF ..........................12

2.1.1. Khái niệm.........................................................................................12

2.1.2. Lịch sử .............................................................................................12

2.1.3. Nền tảng...........................................................................................12

2.1.4. Tích chất phân cụm..........................................................................14

2.2. Kỹ thuật phân rã ma trận không âm NMF và ứng dụng trong mã hóa tiếng

nói 15

2.2.1 Kỹ thuật phân rã ma trận không âm NMF........................................15

2.2.2 Ứng dụng trong mã hóa tiếng nói .....................................................21

2.3. Phương pháp mã hóa tiếng nói dùng NMF của Xue .................................22

2.4. Phương pháp mã hóa NMF của Chien ......................................................28

CHƯƠNG 3 ĐÁNH GIÁ THỰC NGHIỆM PHƯƠNG PHÁP MÃ HÓA

TIẾNG NÓI DÙNG KỸ THUẬT PHÂN RÃ MA TRẬN KHÔNG ÂM

NMF................................................................................................................ 36

3.1. Thu thập dữ liệu tiếng nói ........................................................................36

3.1.1. Ngữ âm tiếng Việt............................................................................36

3.1.1.1. Cấu trúc âm tiết tiếng Việt .....................................................36

3.1.1.2. Thanh điệu tiếng Việt.............................................................37

3.1.2. Cơ sở dữ liệu tiếng nói tiếng Việt ..........................................................38

3.1.2.1 Cơ sở dữ liệu tiếng nói phát thanh VOV.................................38

3.1.2.2 Cơ sở dữ liệu DEMEN567 ......................................................39

3.1.2.3 Cơ sở dữ liệu MICA VNSpeech .............................................39

3.1.3. Tổng hợp tiếng nói tiếng Việt.........................................................40

3.2. Cài đặt phương pháp mã hóa trên Matlab .................................................40

Tải ngay đi em, còn do dự, trời tối mất!
Nghiên cứu phương pháp mã hóa tiếng nói dùng kỹ thuật phân rã ma trận không âm | Siêu Thị PDF