Thư viện tri thức trực tuyến
Kho tài liệu với 50,000+ tài liệu học thuật
© 2023 Siêu thị PDF - Kho tài liệu học thuật hàng đầu Việt Nam

Cấu trúc formant của nguyên âm tiếng Việt trong kết hợp với âm tắc và thanh điệu (Trên cơ sở khảo sát thực nghiệm)
Nội dung xem thử
Mô tả chi tiết
1
MỞ ĐẦU
1. LÍ DO CHỌN ĐỀ TÀI
Tiếng Việt là một ngôn ngữ thuộc loại hình đơn lập, trong đó mỗi âm
tiết là một đơn vị hoàn chỉnh độc lập, là đơn vị cuối cùng trong việc phân xuất
các đơn vị của lời nói, đồng thời âm tiết cũng là cơ sở để phân tích cấu trúc
kết hợp các âm vị.
Các âm vị trong tiếng Việt có ba loại: nguyên âm, phụ âm và thanh
điệu. Nguyên âm và phụ âm là những âm vị tuyến tính, chúng kết hợp với
nhau theo trật tự trước sau trong quá trình phát âm. Chúng là những âm vị có
thể phân tách ra thành từng đơn vị nhỏ hơn, nên còn gọi là những âm vị đoạn
tính. Trái với loại âm vị trên, thanh điệu là âm vị phi tuyến tính, bao trùm toàn
bộ âm tiết và gắn liền với âm tiết trong suốt quá trình phát âm. Thanh không
thể chiết ra khỏi âm tiết được, mà nhất thiết phải gắn với âm tiết, vì thế nên
thanh còn gọi là âm vị siêu đoạn tính.
Chính do vai trò của âm tiết như vậy nên từ lâu nhiều tác giả đã quan
tâm nghiên cứu đơn vị cơ bản này, đặc biệt là bằng phương pháp thực
nghiệm. Các công trình thực nghiệm đã được công bố nhiều hơn cả là nghiên
cứu về hệ thanh điệu và formant của nguyên âm đơn.
Có thể coi Lê Văn Lý là người đầu tiên nghiên cứu thực nghiệm về
thanh điệu. Những nghiên cứu thực nghiệm về thanh điệu tiếng Việt còn có
thể kể: Nguyễn Hàm Dương (1962); Han Mieko(1968), Hoàng Cao cương
(1982); Cao Xuân Hạo (1986), Vũ Kim Bảng (1984), Nguyễn Văn Lợi, Vũ
Thanh Phương, Andrea Phạm Hoa...
Những nghiên cứu thực nghiệm về formant tiếng Việt có thể kể:
Nguyễn Văn Ái (1973, 1974); Vũ Kim Bảng (2002).
2
Tuy nhiên, trong phạm vi âm tiết tiếng Việt, xét về các đặc trưng âm
học của nó, còn có một số vấn đề chưa được đề cập tới, đó là: mối quan hệ
hay vai trò của âm đầu và âm cuối đối với nguyên âm (formant) và thanh điệu
(âm vực và đường nét). Những kết quả nghiên cứu này có giá trị cả về mặt lí
thuyết cũng như ứng dụng thực tiễn.
Trong vòng 50 năm qua, công nghệ thông tin đã phát triển nhanh chóng
và mạnh mẽ. Trong xu hướng chung đó cùng với vai trò của mạng Internet và
thông tin di động viễn thông nói riêng, sự phát triển các hệ tự động nhận dạng
và tổng hợp tiếng nói như là một nhu cầu tất yếu. Trên thế giới đã có những
bộ phần mềm thương mại thuộc lĩnh vực này dành cho tiếng Anh như: IBM
Via Voice, Dragon Naturally Speaking, L&H Voice Xpress. Gần đây nhất,
hãng Microsoft đã công bố việc tích hợp VUI (Voice User Interface) thay cho
GUI (Graphic User Intreface) truyền thống vào phiên bản điều hành Windows
thế hệ mới.
Tại Việt Nam, nội dung nghiên cứu về nhận dạng tiếng Việt đã được đề
cập tới từ năm 1981. Bắt đầu từ năm 1991 cho đến nay, trong các chương
trình, đề tài về khoa học và công nghệ, vấn đề nhận dạng và tổng hợp tiếng
Việt luôn là một nội dung được ưu tiên. Gần đây, nhiều đề tài các cấp về
nghiên cứu phát triển công nghệ nhận dạng và tổng hợp và xử lí ngôn ngữ
tiếng Việt đã có những kết quả đột phá trong lĩnh vực này.
Trong giai đoạn hiện nay, vấn đề xử lí tiếng Việt cho tổng hợp và nhận
dạng là một nhu cầu cấp bách đòi hỏi có những nghiên cứu thực nghiệm cụ
thể về ngữ âm tiếng Việt.
Từ những tiền đề trên chúng tôi lựa chọn đề tài: Cấu trúc formant của
nguyên âm tiếng Việt trong kết hợp với âm tắc và thanh điệu (Trên cơ sở khảo
sát thực nghiệm) làm đề tài luận án.
3
2. TỔNG QUAN
2.1. Những nghiên cứu về formant của nguyên âm trên thế giới
Formant và cấu trúc formant của nguyên âm là một trong những lĩnh
vực nghiên cứu mang tính ứng dụng cao đã được thực hiện ở nhiều ngôn ngữ
trên thế giới. Theo hướng nghiên cứu này, người ta đã thu được nhiều thành
công và đã có kết quả nghiên cứu ứng dụng vào công nghệ xử lí tiếng nói:
phần mềm tổng hợp tiếng nói thực hiện bằng phương pháp tổng hợp formant
đã được tích hợp vào các tiện ích của điện thoại di động, hộp thư trả lời tự
động, xếp hàng tự động... Những tiến bộ và điều kiện kĩ thuật hiện nay, đặc
biệt là sự phát triển của công nghệ thông tin cho phép các nhà khoa học
nghiên cứu một cách toàn diện và có hệ thống đặc trưng âm học của các ngôn
ngữ nói chung và của nguyên âm nói riêng.
Vào thế kỉ thứ 19, các nhà khoa học đã nhận thấy vai trò của cộng
hưởng trong bộ máy phát âm, đặc biệt là cấu trúc formant của nguyên âm
trong việc tạo ra bộ máy phát âm nhân tạo, tiền đề cho những máy tổng hợp
lời nói và phần mềm tổng hợp có thể bắt chước giọng nói của con người trong
những năm sau này. Các nhà ngữ âm học và cả kĩ sư tin học trong lĩnh vực
công nghệ tiếng nói đã quan tâm đến ba khía cạnh của formant trong lời nói
tự nhiên: đặc điểm cấu trúc formant, đặc điểm địa phương (regional
characteristics), và đặc trưng cá nhân của người nói (subject characteristics).
Đặc điểm cấu trúc âm học của formant được nghiên cứu khảo sát sâu
và kĩ hơn ở nhiều ngôn ngữ khác nhau mà điển hình là tiếng Anh. Việc lập
bản đồ âm học các nguyên âm tiếng Anh đã thực hiện bằng cách dùng tần số
formant của các nguyên âm làm cơ sở. Việc lập bản đồ nguyên âm này được
tiến hành ngay sau khi xuất hiện máy phân tích phổ lời nói, do hai tác giả
Peterson và Barney tiến hành vào năm 1952, các tác giả đã phân tích một tập
4
hợp gồm 10 nguyên âm đơn của mỗi người nói trong tổng số 76 người gồm cả
nam, nữ và trẻ em [126, tr 175].
Các tác giả cũng chỉ ra rằng ở những người khác nhau có sự hiện thực
hoá về mặt ngữ âm rất khác nhau trong phát âm các nguyên âm của họ, nhưng
họ vẫn duy trì các đối lập hệ thống một cách bình thường. Vì vậy, hai người
phát âm có thể thay đổi về hình dáng khoảng cách nguyên âm, và các giá trị
formant đối với âm / /, chẳng hạn, ở người này có thể gần với các giá trị
formant đối với âm / / ở người kia; nhưng cả hai người đều sẽ thể hiện nét
khu biệt âm học thoả đáng giữa / / và / / trong hệ thống nguyên âm của họ.
Bên cạnh đó, những người khác nhau có trường độ riêng của bộ máy phát âm,
và những khác biệt này có ảnh hưởng cố hữu lên mô hình các giá trị formant
theo nhiều cách mà người phát âm cũng thực sự không thể kiểm soát nổi. Vì
thế không có một phân biệt tuyệt đối về mặt âm học giữa các nguyên âm cận
kề hoặc gần nhau đối với nhiều người khác nhau. Là người sử dụng ngôn ngữ
mọi người hầu như không gặp khó khăn gì trong việc giải quyết vấn đề này,
vì chúng ta có thể, chỉ cần một mẫu lời nói rất nhỏ của một người nói bình
thường đối với hệ thống nguyên âm của người đó. Nói cách khác, chúng ta có
thể điều chỉnh bản đồ này ở tất cả mọi người, nhưng vẫn có những vùng
chung nhất định phụ thuộc vào giới tính, tuổi tác cũng như giọng nói của từng
vùng phương ngữ [126, tr 178].
Khi nghiên cứu tần số của các formant phía trên, Peterson và Barney
(1952) đã tiến hành thu âm các nguyên âm tự nhiên ở các từ bắt đầu bằng /h/
và kết thúc bằng /d/ của nhiều người khác nhau (đàn ông, phụ nữ và trẻ em),
các tác giả đã phân tích cấu trúc formant của những nguyên âm này, và hình
thành nên những nghiên cứu thẩm nhận bằng cách dùng các bản ghi âm tương
tự. Từ phân tích của hai ông, rồi đến công trình của Shepard (1972) sau này,
đã chỉ ra rằng ở đâu có sự nhầm lẫn thẩm nhận thì ở đó chúng có liên quan
5
mật thiết với sự gần gũi âm học được xác định bằng ba formant thấp nhất. Tư
liệu của họ cũng cho thấy một mức thay đổi đáng kể giữa các nguyên âm
được coi là điển hình và sự gối lên nhau giữa các nguyên âm khác nhau. Các
tác giả đã chỉ ra sự thay đổi của rất nhiều nguyên âm khác nhau khi các
formant của chúng được dựng lên so sánh với nhau [126, tr 176].
Những tư liệu này đã hé mở một khía cạnh quan trọng trong hoạt động
tiếp nhận nguyên âm, đặc biệt là bản chất hệ thống của formant liên quan đến
các giá trị tuyệt đối của chúng. Họ đã lưu ý rằng có một sự đa dạng trong các
thuộc tính âm học của các nguyên âm ở trẻ em, phụ nữ và đàn ông nảy sinh từ
những khác biệt về độ dài của bộ máy phát âm, cũng như sự đa dạng do
những khác biệt giữa các cá thể ở bộ máy phát âm và thay đổi mang tính thói
quen của cơ quan phát âm. Kết quả là nhiều nhà nghiên cứu đã lập ra các
thuật toán nhằm chuẩn hoá nét biến thể của tư liệu, trên cơ sở sự khác biệt về
trường độ của bộ máy phát âm.
Thí nghiệm của Ladefoged và Maddieson chứng minh các tần số
formant xác định đặc trưng âm vị học của hệ thống nguyên âm. Bằng việc
dùng lời nói tổng hợp, họ đã chứng minh nếu một hệ thống nguyên âm trong
một câu bị dịch chuyển thì người nghe sẽ thẩm nhận sự di chuyển mang tính
hệ thống của nguyên âm vào trong đường giao âm học của một nguyên âm
khác xét về mặt âm vị học.
Ví dụ: nguyên âm của từ head (cái đầu) có thể bị làm cho nghe thành
nguyên âm của từ hid (trốn) nếu các tần số formant của tất cả các nguyên âm
khác bị hạ xuống. Dường như người nghe có thể tiếp nhận một cách bình
thường đối với một người nói ở một vài từ ban đầu mà họ nghe thấy [109, tr
74].
Bên cạnh những kết quả nghiên cứu cấu trúc formant của tiếng Anh cấu
trúc formant của các nguyên âm tiếng Thụy Điển cũng được nghiên cứu rất kĩ
6
lưỡng trong các công trình của G. Fant và các cộng sự (1959). Việc khảo sát
thực nghiệm được thực hiện với một nhóm 24 sinh viên nam tại Viện Kĩ thuật
Hoàng gia, những người từng tham gia một khóa học truyền thông, họ đọc
một danh sách các nguyên âm độc lập tiếng Thụy Điển bao gồm: /o, a, ă, e, i,
y, u, o / với khoảng cách 1,5 giây giữa các âm. Tương ứng với bảng phiên âm
quốc tế IPA của các kí tự được phát âm là /u:, o:, a:, e:, y:, i:/. Tần số formant
được đo qua bộ lọc mẫu phổ tại một vị trí thời gian bằng 1/4 độ dài của
nguyên âm. Mục đích trong nghiên cứu của Fant là tập hợp một dữ liệu liên
quan đến tần số formant của nguyên âm tiếng Thụy Điển. Những nghiên cứu
của Fant (1959) nhằm phục vụ những ứng dụng của công ty điện thoại
Erricson từ năm 1946 đến 1948. Thời gian đầu những nguyên âm trong
nghiên cứu được thể hiện trong khoảng thời gian là 4 giây để thực hiện một
dải phân tích tần số. Những nghiên cứu bước đầu của Fant có những hạn chế
trong việc tạo ra giọng nói tổng hợp một cách đều đặn và giọng này được thể
hiện giống như tiếng hát hơn là lời nói. Trong nghiên cứu tiếp theo, dữ liệu
được bổ sung là giọng nói của trẻ em và phụ nữ, giới hạn của nghiên cứu hiện
tại chỉ gồm các nguyên âm dài [92, tr 1]. Ngoài ra, trong công trình “Stops in
CV”, Fant cũng đã mô tả ảnh hưởng của phụ âm tắc đến formant của nguyên
âm tiếng Thụy Điển ở trường độ và vùng tần số giữa phụ âm và nguyên âm.
Năm 1998, Manjari Ohala và John J. Ohala đã tiến hành khảo sát sự
tương quan giữa các chuyển tiếp (formant) trong cấu trúc VC phụ âm tính
(trong đó V là các nguyên âm /a i u/ còn C là các phụ âm /p t t k/) với
mức độ lẫn lộn của thính giác về đối lập vị trí trong tiếng Hindi. Bằng thủ
pháp thử và sai, tác giả đã đánh giá vai trò của các chuyển tiếp formant VC
độc lập với sự giải phóng âm tắc [124, tr1].
Năm 1999, James J.Hant và Abeer Alwan đã nghiên cứu và lập mô
hình cho chuyển tiếp formant trong bối cảnh nhiễu. Đánh giá cao vai trò quyết
7
định của chuyển tiếp formant trong việc nhận ra vị trí cấu âm của các phụ âm,
các tác giả đã đưa ra giả định nếu chuyển tiếp formant này “nhúng” vào trong
một môi trường nhiễu, và tiến hành xác định ngưỡng của các trượt lướt thanh
điệu (tone glides) và đường formant cá thể ở các tần số khác nhau, có trường
độ khác nhau. Kết quả nghiên cứu cho thấy ngưỡng là độc lập với mức tần số
và chỉ phụ thuộc vào trường độ và tần số trung tâm của chuyển tiếp [96, tr
1896].
Năm 1958, trong bài viết Effect of Third-Formant Transitions on
Perception of Voiced Stop Consonants đăng trên The Journal of Acoustical
Society of America, Vol. 30, No. 2, 122-126, tác giả dựa trên lời nói tổng hợp
(synthetic speech) đã tiến hành thực nghiệm và đi đến nhận xét “chuyển tiếp
formant thứ ba là chìa khóa cho việc thẩm nhận các âm /b d /”, “sự đa dạng
của chuyển tiếp formant thứ ba tương ứng cặp đôi với chuyển tiếp formant
thứ hai ở vị trí đầu trước nguyên âm /i/ và / /”. Từ kết quả miêu tả về chuyển
tiếp và mức độ ổn định của formant thứ ba các tác giả đi đến nhận xét “sự tồn
tại của locus formant thứ ba tương tự với locus đã được tìm thấy trước đó đối
với formant thứ nhất và thứ hai” [103, tr 124].
Cũng năm 1958, P.C. Delattre, A. M. Liberman, F. S. Cooper qua khảo
sát âm xát tiếng Anh Mĩ, đã cho rằng chuyển tiếp formant là các tương liên
âm học của vị trí cấu âm. Tác giả cũng đã tổng kết những nghiên cứu đã có
trước đó và cho rằng có hai loại tín hiệu âm học để nhận ra vị trí cấu âm của
phụ âm: một là những đặc trưng bản thể, có ở âm tắc (stop) ,âm xát, và âm
tắc xát, là điểm mà tỉ lệ tần số của tiếng ồn hay tiếng rít được tạo ra tại điểm
rít, và hai là những chuyển tiếp hay biến đổi (sự thay đổi tần số tương đối
nhanh) của các formant thứ hai và thứ ba. Trong bài viết này, các tác giả cũng
khẳng định chuyển tiếp của formant thứ hai và thứ ba là những dấu hiệu nhận
dạng vị trí cấu âm của phụ âm theo hướng chuyển dịch tần số [87, tr 773].
8
Năm 1955, nhóm tác giả này trong bài viết "Acoustic Loci and
Transitional Cues for Consonants" cho rằng những nghiên cứu tổng hợp tiếng
nói trước đây đã mô tả sự quá độ của formant thứ hai là những tiêu điểm cho
nhận dạng các phụ âm tắc và mũi. Kết quả của những thí nghiệm này có thể
đơn giản hóa nếu nó giả định rằng: mỗi phụ âm có một nét đặc trưng và vị trí
tần số cố định, hoặc tiêu điểm cho formant thứ hai, tương ứng với vị trí cố
định của cơ chế tạo phụ âm. Trên nền tảng đó, những dấu hiệu quá độ có thể
được xem như "những sự biến động (sự vận động)" từ tiêu điểm tới trạng thái
bền vững của nguyên âm. Thí nghiệm trong bài viết này đã cung cấp thêm
một bằng chứng liên quan đến sự tồn tại và những vị trí là tiêu điểm của
formant thứ hai cho những phụ âm tắc hữu thanh /b, d, g/. Ở đó xuất hiện một
tiêu điểm cho /d/ tại 1800 cps và cho /b/ tại 720 cps. Một tiêu điểm cho /g/ có
thể được chứng minh chỉ khi nguyên âm bên cạnh có formant thứ hai của nó
trên khoảng 1200 cps. Đối với những phụ âm tắc hữu thanh, thời kì quá độ
không thể bắt đầu tại tiêu điểm và đi từ điểm đó đến vị trí cố định của nguyên
âm. Đúng hơn là, nếu chúng ta nghe phụ âm một cách thích hợp, phần đầu
của đoạn quá độ phải là khoảng lặng. Và nghiên cứu chỉ ra rằng, trong tổng
hợp lời nói phụ âm tắc hữu thanh được tổng hợp tốt nhất bằng cách tạo ra
trường độ thời gian giữa các khoảng lặng cân bằng với trường độ của chính
đoạn quá độ [88, tr 771].
Năm 1995, một nghiên cứu chuyển tiếp formant giữa âm tiết đầu có kết
thúc là nguyên âm và âm tiết thứ hai có nguyên âm là âm đầu trong chuỗi kết
hợp hai âm tiết trong tiếng Trung Quốc chuẩn cũng đã được nghiên cứu, (Yan
Jingzhu). Trong nghiên cứu này 661 chuỗi kết hợp âm tiết tiếng Trung trong
đó âm tiết đầu có kết thúc là nguyên âm và âm tiết thứ hai bắt đầu bằng một
nguyên âm (VV) được một người bản ngữ nam nói tiếng Bắc Kinh tạo ra, âm
thanh tiếng nói là chuỗi kết hợp âm tiết được phân tích bằng máy Kay và
9
Sonagraph 5500. Kết quả cho thấy một sự chuyển tiếp formant được hình
thành trong kết hợp âm tiết. Tần số formant có giá trị tại điểm bắt đầu của sự
chuyển tiếp cân bằng với formant của nguyên âm hạt nhân của âm tiết đầu
[97, tr 42].
Đặc điểm địa phương ở formant được quan tâm nghiên cứu trên
phương diện tìm các đặc trưng phương ngữ thể hiện trong cấu trúc của
formant. Theo hướng này, người ta mới chỉ quan tâm đến những khác biệt
vùng địa phương formant của một ngôn ngữ. Ví dụ bài viết "Tần số formant
của nguyên âm trong âm tiết /hVd/ trong lời nói của phụ nữ người miền Nam
Australia" của Andrew Butcher, năm 2006.Trong khoảng thời gian 5 năm
(2002 - 2006) các nguyên âm được ghi âm bởi các sinh viên năm thứ hai
chuyên ngành bệnh học lời nói tại trường đại học Flinder ở Adelaide. Trong
nghiên cứu này, dữ liệu chỉ bao gồm những phụ nữ trẻ, những người lớn lên ở
miền nam Australia (n = 92, độ tuổi trung bình là 22 tuổi), đa số họ được huấn
luyện. Trước khi phát âm danh sách các từ có cấu trúc /hVd/ được chuẩn bị
trước và ba dấu hiệu của mỗi nguyên âm là đọc từ những danh sách ngẫu
nhiên. (năm 2006, n = 22 ghi âm cộng thêm vào từ "Who'll (ai sẽ) " theo trật
tự tạo ra dấu hiệu của tha âm vị trước bên của /u/). Trong tất cả các trường
hợp lời nói được ghi âm trực tiếp trên ổ cứng máy vi tính trong môi trường
yên tĩnh, số hóa tại 22,5kHz, với độ phân giải 16 - bit. Tần số formant được
đo được từ sự hiển thị LPC, những điểm đo được xác định bằng sự liên quan
tới những dải phổ rộng, sử dụng chương trình SIL phân tích tiếng nói (phiên
bản thuộc 1.5 đến 2.7). Formant được đo ở giữa của sự phân chia đều đặn F1
lớn đối với nguyên âm mở và F1 nhỏ cho những nguyên âm đóng. Nguyên
âm đóng /i/ và /u/ trong trường hợp đặc biệt thường không đạt tới F1 nhỏ này
cho đến khi nguyên âm kết thúc hoàn toàn. Kết quả miêu tả giá trị trung bình
10
formant thu được cho tất cả các nguyên âm bao gồm cả nguyên âm đơn và
nguyên âm đôi của những người ở miền nam Australia [81, tr 450].
Đặc trưng cá nhân người nói thể hiện ở cấu trúc formant bao gồm giới
tính, độ tuổi và cả những người mắc các tật phát âm như nói lắp, nói ngọng
hay phẫu thuật thanh quản... Và mô hình chuyển tiếp formant đặc thù cá nhân
thể hiện trong một vài tổ hợp âm học. "Cấu trúc formant của nguyên âm được
tạo ra bởi những người có tật nói lắp với tốc độ nói nhanh và bình thường".
Trong nghiên cứu này tác giả Martine Toda, Shinji Maeda, Micheal Aron, và
Marie-Odile Berger đã phân tích phần cố định của hai formant F1 và F2 trong
cấu trúc CV, chứa nguyên âm /a, i, u/ được phát âm với hai tốc độ nhanh và
bình thường, bởi hai nhóm: được điều trị tật nói lắp và không được điều trị tật
nói lắp. Quỹ tích bằng nhau được tính toán để quan sát những khả năng khác
nhau trong đồng cấu âm giữa ba nhóm. Dữ liệu phân tích bộc lộ sự giảm bớt
khoảng cách của nguyên âm cho những người mắc tật nói lắp trong lời nói
bình thường. Khi tốc độ lời nói tăng lên, dễ nhận thấy khoảng cách nguyên
âm không hề giảm đối với những nhóm người nói sau, tương phản với cách
xem xét những người nói lắp với tốc độ nhanh [134, tr 357].
2.2. Những nghiên cứu về formant của nguyên âm tiếng Việt
Nghiên cứu formant của nguyên âm tiếng Việt đã được một tác giả
người nước ngoài là Han Mieko (1968) đề cập đến khi thực hiện một loạt
nghiên cứu âm vị học các ngôn ngữ châu Á. Cụ thể, trong công trình "Studies
in phonology of Asian Languages: Vietnamese Vowel" 11 nguyên âm đơn
tiếng Hà Nội đã được nghiên cứu và mô tả. F1 và F2 của 11 nguyên âm được
đo, phân tích, cuối cùng tác giả đi đến kết luận rằng có sự chi phối ảnh hưởng
bởi các yếu tố khác là thanh tính và phụ âm tính đến chất lượng của nguyên
âm. Khi thực hiện một nghiên cứu về trường độ cố hữu của 11 nguyên âm
đơn tiếng Việt, kết quả nghiên cứu của Han Mieko cho thấy có sự ảnh hưởng
11
của thanh điệu đối với các cấu trúc formant của nguyên âm. Theo bà thanh 6
làm thay đổi vị trí F1 của nguyên âm, nó ảnh hưởng mạnh nhất đến các
nguyên âm có độ mở hẹp và trung bình và ảnh yếu đến các nguyên âm có độ
mở rộng. Thanh này hầu như không ảnh hưởng đến F2 [98, tr 92].
Khi nghiên cứu số lượng formant của nguyên âm tiếng Việt, Nguyễn
Văn Ái (1974) đã phân tích 11 nguyên âm đơn tiếng Việt ở vị trí mạnh
(nguyên âm đứng riêng thành âm tiết) và ở vị trí yếu (nguyên âm nằm trong
kết hợp âm tố, nhằm để phân tích hai nguyên âm ngắn ă, â là hai nguyên âm
không bao giờ xuất hiện riêng thành âm tiết) bằng máy xônagorap đã ghi
được khoảng 1300 đơn vị âm tiết do ba người phát âm (1 nữ, 2 nam). Kết quả
thực nghiệm cho thấy: số lượng formant của mỗi nguyên âm không giống
nhau hoàn toàn. Ở nguyên âm u, thường xuất hiện từ một đến hai formant; đôi
khi có formant thứ ba nhưng cường độ rất yếu. Những nguyên âm khác có số
lượng formant tương đối cố định: /i, e, , , , o, / đều có bốn formant,
riêng /o/, trong một số biến thể phát âm cá nhân, chỉ xuất hiện hai formant; ở
/e, a, ă/, xuất hiện năm formant, riêng /ă/ có khi chỉ có 4 formant. Phần lớn
những formant thứ 4, thứ 5 này có cường độ rất yếu. Tác giả kết luận các
nguyên âm đơn tiếng Việt có từ 2 đến 5 formant. [2]
Trước đó, năm 1973 trong bài viết công bố trên tạp chí Ngôn ngữ,
Nguyễn Văn Ái khi nghiên cứu thực nghiệm về mặt vật lí, với việc phân tích
400 ảnh sóng âm của 9 nguyên âm đơn tiếng Việt được lấy từ 10 CTV. Tác
giả đi đến kết luận: Ngoài đặc điểm cấu âm đầu tiên chung của các nguyên âm
là sự sản sinh tiếng thanh cơ bản trong thanh quản ra, tất cả các nguyên âm
tiếng Việt đều được hình thành cuối cùng ở khoang miệng (không có sự tham
gia của khoang mũi, vì khi cấu âm, phần sau của ngạc mềm nâng lên đóng
chặt đường thông lên khoang mũi). Do đó, chính hiện tượng cấu âm ở khoang
miệng: độ mở của miệng, góc độ của hàm và vị trí của lưỡi là nguyên nhân
12
trực tiếp có tính chất quyết định đến hiệu quả âm học của từng nguyên âm.
Trong nghiên cứu này, tác giả đã đưa ra vùng tần số F1 và F2 của từng
nguyên âm tiếng Việt như sau:
Nguyên âm F1 F2
i 250 - 420 Hz 2380 - 3360 Hz
ê 354 - 595 Hz 2000 - 2830 Hz
e 595 - 840 Hz 1630 - 2380 Hz
ư 250 - 420 Hz 840 - 1190 Hz
ơ 354 - 595 Hz 1000 - 1190 Hz
a 707 - 1000 Hz 1190 - 1410 Hz
u 250 - 420 Hz 595 - 840 Hz
ô 354 - 595 Hz 707 - 1000 Hz
o 595 - 707 Hz 840 - 1000 Hz
Kết quả thực nghiệm của các nguyên âm tiếng Việt cho thấy, những F1
của các nguyên âm dòng trước, dòng giữa và dòng sau có cùng độ nâng lưỡi
thường nằm trong vùng tần số formant giống nhau hoặc gần giống nhau. Ví
dụ: /i, , u/, /e, , o/, và / , / có thể thay thế nhau được ở vùng tần số F1
này. Vậy những tiêu chí khu biệt các nguyên âm cùng nhóm trên là ở những
F2 có vùng tần số lớn hơn các F1.
Nguyên âm dòng trước /i, e, / có vùng tần số F1 và vùng tần số F2
nằm cách xa nhau; u, o, là những nguyên âm dòng sau, bản thân chúng có
vùng tần số F1 và F2 cách nhau trung bình. Các nguyên âm tiếng Việt nằm
trong khoảng tần số 250 -3800Hz [1].
Hoàng Cao Cương (1986) [13] khi phân tích các sonagram đã nhận
thấy ở các âm tiết có chứa các thanh điệu 1, 3, 5, F2 của nguyên âm thường
được thể hiện rõ hơn, trong khi đó các âm tiết chứa các thanh còn lại thể hiện
13
F1 rõ hơn. Về dạng của formant, trong mọi trường hợp các F1 đều bằng
phẳng, trong khi F2 của các âm tiết chứa các thanh 3, 5 lại có dạng đi lên. Tác
giả cho rằng nếu quan niệm F2 là đặc trưng quan trọng của nguyên âm thì dễ
nhận thấy trong hệ thanh điệu Việt chỉ có thanh 1 là giúp cho dễ nhận diện
các chiết đoạn. Các thanh 4 và 6 làm cho người ta khó nhận diện các đoạn
nằm ở vị trí chung âm. Các thanh 3 và 5 có những ảnh hưởng nhất định đối
với F2.
Ngoài ra khi nghiên cứu sự ảnh hưởng của phụ âm tới nguyên âm, tác
giả nhận thấy đặc trưng chuyển tiếp giữa C1 tới V và từ V tới C2 rất khác
nhau. Trong khi các chuyển tiếp C1V thường dễ dàng được thẩm nhận vì kích
thước lớn (giảm hoặc tăng cường độ từ 3-5dB, trường độ ít nhất là 15ms) thì
các chuyển tiếp VC2 thường thể hiện mờ nhạt (dao động và biến thái cường
độ không vượt quá 2dB, trường độ không vượt quá 10ms). Trong khi các
dạng chuyển tiếp C1V thường ổn định, phụ thuộc chặt chẽ vào các đặc trưng
cố hữu của C1 thì chuyển tiếp VC2 thường chỉ phụ thuộc vào đặc trưng cố
hữu của V và thanh điệu mà âm tiết chuyển tải. Các dạng chuyển tiếp của
C1V trong âm tiết kiểu Việt là bị nổi bật lên, trong khi chuyển tiếp VC2 bị
hòa kết, làm liền lại các chiết đoạn vốn dĩ có các đặc trưng cố hữu khác biệt
nhau. Nếu coi đặc trưng về tính tách biệt như là một biểu hiện quan trọng nhất
của các yếu tố âm thanh chiết đoạn thì có thể kết luận là C1 bảo lưu được
nhiều đặc trưng cố hữu của chúng hơn C2 khi cả hai đều tham gia vào cấu
trúc âm tiết. Xét từ quan điểm chiết đoạn, C1 là đồng chất hơn C2.
Một tình trạng tương tự xảy ra trong khu vực các âm thanh vốn được
coi là siêu đoạn của tiếng Việt. Nếu coi rằng điệu tính là nét ngữ âm (hoặc)
chùm nét ngữ âm hành chức bao trùm lên một chỉnh thể lớn hơn một chiết
đoạn và sự thể hiện nó là có tính quy luật theo đặc điểm tuyến tính của cấu
trúc chỉnh thể ấy (được phân bố theo thời gian), thì trong số thanh Việt chỉ có