Thư viện tri thức trực tuyến
Kho tài liệu với 50,000+ tài liệu học thuật
© 2023 Siêu thị PDF - Kho tài liệu học thuật hàng đầu Việt Nam

Tài liệu Nhận dạng tiếng Việt dùng mạng neuron kết hợp trích đặc trưng dùng LPC và AMDF pdf
Nội dung xem thử
Mô tả chi tiết
Abstract: This paper describes a method of creating
neural network based isolated Vietnamese speech
recognizer. The formant extraction process uses the current
popular model LPC (Linear Predictive Coding) in which
LPC parameters are converted to cepstral coefficients. The
neural network is used to estimate the word probabilities
and we will choose the maximum for the target words. We
also combine LPC method with AMDF (Average
Magnitude Difference Function) method to increase the
accuracy. The experiments are stimulated by Matlab 6.5.
The high accuracy of results leads the conclusion that the
studied way is suitable.
Keyword: Vietnamese speech recognition, Neural
Network, LPC, AMDF.
I. GIỚI THIỆU
Nhận dạng tiếng nói là một kỹ thuật có thể ứng
dụng trong rất nhiều lĩnh vực của cuộc sống: trong
việc điều khiển (điều khiển robot, động cơ, điều khiển
xe lăn cho người tàn tật...), an ninh quốc phòng... Ở
Việt Nam, trong những năm gần đây đã có một số kết
quả nghiên cứu ban đầu về nhận dạng tiếng Việt, tuy
nhiên còn có giới hạn về độ chính xác, số từ, vấn đề
thanh điệu đặc thù tiếng việt hầu như chưa được đề
cập.... Bài báo trình bày một hướng ứng dụng thanh
điệu vào việc nhận dạng tiếng Việt đọc rời rạc nhằm
nâng cao độ chính xác: phương pháp kết hợp trích đặc
trưng bằng LPC với trích chu kỳ cơ bản dùng AMDF
cho kết quả nhận dạng chính xác cao qua thử nghiệm.
II. CƠ SỞ LÝ THUYẾT
1. Mã hóa dự báo tuyến tính (LPC - Linear
Predictive Coding) [4]
Gọi r(k) là giá trị tự tương quan của tín hiệu dời đi k
mẫu:
∑
∞
=−∞
= + n
r(k) x(n)x(n k) (1)
Khi đó các hệ số LPC sẽ là nghiệm của hệ phương
trình:
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎦
⎤
⎢
⎢
⎢
⎢
⎢
⎢
⎢
⎢
⎢
⎣
⎡
=
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎦
⎤
⎢
⎢
⎢
⎢
⎢
⎢
⎢
⎢
⎢
⎣
⎡
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎦
⎤
⎢
⎢
⎢
⎢
⎢
⎢
⎢
⎢
⎢
⎣
⎡
− − −
−
−
−
( )
.
.
.
(3)
(2)
(1)
.
.
.
( 1) ( 2) ( 3) . (0)
. . . .
. . . .
. . . .
(2) (1) (0) ... ( 3)
(1) (0) (1) ... ( 2)
(0) (1) (2) ... ( 1)
3
2
1
r P
r
r
r
a
a
a
a
r P r P r P r
r r r r P
r r r r P
r r r r P
P
(2)
Hệ phương trình trên được giải bằng thuật toán
Levinson-Durbin. Tất cả các hệ số LPC sẽ là đặc
trưng của tín hiệu tiếng nói.
a) Thuật toán Levinson-Durbin: [4]
Khởi tạo: p=1
Tính sai số bình phương trung bình bậc nhất:
(0)(1 (1)) 2
1 1 E = r − a (3)
Nhận dạng tiếng Việt dùng mạng neuron kết
hợp trích đặc trưng dùng LPC và AMDF
Vietnamese Speech Recognition Using Neural Networks
Combined with LPC Formant Extraction and AMDF
Pitch-Detection
Hoàng Đình Chiến