Siêu thị PDFTải ngay đi em, trời tối mất

Thư viện tri thức trực tuyến

Kho tài liệu với 50,000+ tài liệu học thuật

© 2023 Siêu thị PDF - Kho tài liệu học thuật hàng đầu Việt Nam

Tài liệu Nhận dạng tiếng Việt dùng mạng neuron kết hợp trích đặc trưng dùng LPC và AMDF pdf
MIỄN PHÍ
Số trang
7
Kích thước
278.8 KB
Định dạng
PDF
Lượt xem
1914

Tài liệu Nhận dạng tiếng Việt dùng mạng neuron kết hợp trích đặc trưng dùng LPC và AMDF pdf

Nội dung xem thử

Mô tả chi tiết

Abstract: This paper describes a method of creating

neural network based isolated Vietnamese speech

recognizer. The formant extraction process uses the current

popular model LPC (Linear Predictive Coding) in which

LPC parameters are converted to cepstral coefficients. The

neural network is used to estimate the word probabilities

and we will choose the maximum for the target words. We

also combine LPC method with AMDF (Average

Magnitude Difference Function) method to increase the

accuracy. The experiments are stimulated by Matlab 6.5.

The high accuracy of results leads the conclusion that the

studied way is suitable.

Keyword: Vietnamese speech recognition, Neural

Network, LPC, AMDF.

I. GIỚI THIỆU

Nhận dạng tiếng nói là một kỹ thuật có thể ứng

dụng trong rất nhiều lĩnh vực của cuộc sống: trong

việc điều khiển (điều khiển robot, động cơ, điều khiển

xe lăn cho người tàn tật...), an ninh quốc phòng... Ở

Việt Nam, trong những năm gần đây đã có một số kết

quả nghiên cứu ban đầu về nhận dạng tiếng Việt, tuy

nhiên còn có giới hạn về độ chính xác, số từ, vấn đề

thanh điệu đặc thù tiếng việt hầu như chưa được đề

cập.... Bài báo trình bày một hướng ứng dụng thanh

điệu vào việc nhận dạng tiếng Việt đọc rời rạc nhằm

nâng cao độ chính xác: phương pháp kết hợp trích đặc

trưng bằng LPC với trích chu kỳ cơ bản dùng AMDF

cho kết quả nhận dạng chính xác cao qua thử nghiệm.

II. CƠ SỞ LÝ THUYẾT

1. Mã hóa dự báo tuyến tính (LPC - Linear

Predictive Coding) [4]

Gọi r(k) là giá trị tự tương quan của tín hiệu dời đi k

mẫu:

=−∞

= + n

r(k) x(n)x(n k) (1)

Khi đó các hệ số LPC sẽ là nghiệm của hệ phương

trình:

=

− − −

( )

.

.

.

(3)

(2)

(1)

.

.

.

( 1) ( 2) ( 3) . (0)

. . . .

. . . .

. . . .

(2) (1) (0) ... ( 3)

(1) (0) (1) ... ( 2)

(0) (1) (2) ... ( 1)

3

2

1

r P

r

r

r

a

a

a

a

r P r P r P r

r r r r P

r r r r P

r r r r P

P

(2)

Hệ phương trình trên được giải bằng thuật toán

Levinson-Durbin. Tất cả các hệ số LPC sẽ là đặc

trưng của tín hiệu tiếng nói.

a) Thuật toán Levinson-Durbin: [4]

Khởi tạo: p=1

Tính sai số bình phương trung bình bậc nhất:

(0)(1 (1)) 2

1 1 E = r − a (3)

Nhận dạng tiếng Việt dùng mạng neuron kết

hợp trích đặc trưng dùng LPC và AMDF

Vietnamese Speech Recognition Using Neural Networks

Combined with LPC Formant Extraction and AMDF

Pitch-Detection

Hoàng Đình Chiến

Tải ngay đi em, còn do dự, trời tối mất!