Siêu thị PDFTải ngay đi em, trời tối mất

Thư viện tri thức trực tuyến

Kho tài liệu với 50,000+ tài liệu học thuật

© 2023 Siêu thị PDF - Kho tài liệu học thuật hàng đầu Việt Nam

Nghiên cứu phương pháp biến đổi cảm xúc người nói trong tiếng nói dùng kỹ thuật phân rã tiếng nói theo thời gian
PREMIUM
Số trang
62
Kích thước
1.7 MB
Định dạng
PDF
Lượt xem
841

Nghiên cứu phương pháp biến đổi cảm xúc người nói trong tiếng nói dùng kỹ thuật phân rã tiếng nói theo thời gian

Nội dung xem thử

Mô tả chi tiết

i

ĐẠI HỌC THÁI NGUYÊN

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG

ĐỖ XUÂN TOÀN

NGHIÊN CỨU PHƯƠNG PHÁP BIẾN ĐỔI CẢM XÚC

NGƯỜI NÓI TRONG TIẾNG NÓI DÙNG KỸ THUẬT

PHÂN RÃ TIẾNG NÓI THEO THỜI GIAN

Chuyên ngành: Kỹ thuật viễn thông

Mã số: 8 52 02 08

LUẬN VĂN THẠC SĨ KỸ THUẬT VIỄN THÔNG

Người hướng dẫn khoa học: PGS.TS. PHÙNG TRUNG NGHĨA

Thái Nguyên - 2021

ii

LỜI CẢM ƠN

Trong quá trình thực hiện luận văn, ngoài sự nỗ lực của bản thân, em đã

nhận được rất nhiều sự hỗ trợ, giúp đỡ. Đầu tiên, em xin chân thành cảm ơn

PGS.TS. Phùng Trung Nghĩa, người đã trực tiếp hướng dẫn em hoàn thành

luận văn. Thầy đã tận tình hướng dẫn, giảng giải chỉ dẫn, với những tài liệu, sự

động viên của thầy đã giúp em vượt qua nhiều khó khăn để hoàn thiện luận văn

này.

Em cũng xin cảm ơn các thầy, cô giảng dạy chương trình cao học "Kỹ

thuật viễn thông” đã truyền dạy những kiến thức quý báu, những kiến thức đó

rất hữu ích và giúp em nhiều khi thực hiện nghiên cứu. Đồng thời, Nhà trường

và các thầy, cô đã tạo mọi điều kiện về thời gian, cơ sở, phương tiện để em

nghiên cứu.

Cuối cùng, em xin gửi lời cảm ơn tới gia đình và bạn bè đã luôn ủng hộ,

động viên, giúp đỡ em trong suốt những năm học vừa qua.

Thái Nguyên, ngày tháng năm 2021

Học viên

Đỗ Xuân Toàn

iii

LỜI CAM ĐOAN

Tôi là: Đỗ Xuân Toàn - Học viên lớp cao học K18 - Kỹ thuật viễn thong

- Trường đại học Công nghệ thông tin và Truyền thông Thái Nguyên.

Tôi xin cam đoan: Luận văn “Nghiên cứu phương pháp biến đổi cảm xúc

người nói trong tiếng nói dùng kỹ thuật phân rã tiếng nói theo thời gian” là

công trình nghiên cứu thực sự của cá nhân, được thực hiện dưới sự hướng dẫn

khoa học của PGS. TS. Phùng Trung Nghĩa.

Các số liệu, những kết luận nghiên cứu được trình bày trong luận văn này

trung thực và chưa từng được công bố dưới bất cứ hình thức nào.

Tôi xin chịu trách nhiệm về nghiên cứu của mình.

Học viên

Đỗ Xuân Toàn

iv

MỤC LỤC

LỜI CẢM ƠN ....................................................................................................i

LỜI CAM ĐOAN ............................................................................................iii

MỤC LỤC........................................................................................................iv

DANH MỤC BẢNG........................................................................................vi

DANH MỤC HÌNH ........................................................................................vii

MỞ ĐẦU .......................................................................................................... 1

1. Đặt vấn đề...................................................................................................... 1

2. Đối tượng và phạm vi nghiên cứu................................................................. 2

3. Hướng nghiên cứu của luận văn ................................................................... 3

4. Những nội dung nghiên cứu chính................................................................ 3

5. Phương pháp nghiên cứu............................................................................... 4

6. Ý nghĩa khoa học của luận văn:.................................................................... 4

CHƯƠNG 1: TỔNG QUAN VỀ TIẾNG NÓI VÀ VẤN ĐỀ BIẾN ĐỔI

THÔNG TIN CẢM XÚC NGƯỜI NÓI TRONG TIẾNG NÓI ....... 5

1.1. Thông tin tiếng nói..................................................................................... 5

1.2. Tín hiệu tiếng nói ....................................................................................... 5

1.3. Quá trình tạo tiếng nói................................................................................ 6

1.4. Cơ quan thính giác ..................................................................................... 9

1.5. Xử lý tiếng nói.......................................................................................... 11

1.6. Thông tin cảm xúc người nói trong tiếng nói .......................................... 12

1.7. Biến đổi cảm xúc người nói trong tiếng nói và ứng dụng ....................... 14

1.7.1. Phương pháp biến đổi thay đổi tham số trực tiếp ................................. 15

1.7.2. Biến đổi cảm xúc người nói dựa vào thay thế khung ........................... 17

1.7.3. Biến đổi thông tin người nói bằng GMM ............................................. 19

v

CHƯƠNG 2: BIẾN ĐỔI CẢM XÚC NGƯỜI NÓI BẰNG KỸ THUẬT

PHÂN RÃ TIẾNG NÓI THEO THỜI GIAN .................................. 24

2.1. Kỹ thuật phân rã tiếng nói theo thời gian................................................. 24

2.1.1. Phương pháp TD nguyên thủy .............................................................. 24

2.1.2. Phương pháp phân rã tiếng nói theo thời gian giới hạn RTD............... 27

2.1.3. Phương pháp MRTD............................................................................. 29

2.2. Một số kỹ thuật biến đổi cảm xúc người nói dùng TD............................ 34

2.2.1. Biến đổi cảm xúc người nói bằng TD-GMM ....................................... 34

2.2.2. Biến đổi cảm xúc người nói bằng HTD [10] ........................................ 36

CHƯƠNG 3: ĐÁNH GIÁ THỰC NGHIỆM CÁC PHƯƠNG PHÁP

BIẾN ĐỔI CẢM XÚC NGƯỜI NÓI TRONG TIẾNG NÓI.......... 43

3.1. Ngữ âm tiếng Việt.................................................................................... 43

3.2. Cơ sở dữ liệu tiếng nói tiếng Việt ............................................................ 45

3.3. Tổng hợp tiếng nói tiếng Việt .................................................................. 47

3.4. Lựa chọn cơ sở dữ liệu............................................................................. 48

3.5. Thực nghiệm các phương pháp................................................................ 48

3.6. Đánh giá các phương pháp....................................................................... 49

3.6.1. Tiêu chí và kết quả đánh giá khách quan.............................................. 49

3.6.2. Tiêu chí và kết quả đánh giá chủ quan.................................................. 50

KẾT LUẬN.................................................................................................... 52

TÀI LIỆU THAM KHẢO ............................................................................ 53

vi

DANH MỤC BẢNG

Bảng 3.1: Cấu trúc âm tiết tiếng Việt.............................................................. 44

Bảng 3.2: Sáu thanh điệu tiếng Việt ............................................................... 45

Bảng 3.3: Các tham số thực nghiệm ............................................................... 45

Bảng3.4: Khoảng cách MCD trung bình của 4 mẫu..................................... 511

Bảng3.5: Độ sai lệch F0 trung bình của 4 mẫu............................................... 51

Bảng3.6: Kết quả đánh giá chủ quan ABX trung bình của 4 mẫu giữa các

phương pháp TD-GMM (1); HTD (2)............................................ 51

Tải ngay đi em, còn do dự, trời tối mất!