صدای حنجره(Voice) به عنوان منبع صـدا
درکِ ویژگیهای صدایِ خارج شده از حنجره مهم است. در حالی که زبان میتواند وجه مشترک گروهی از مردم باشد، سرشت و صدای حنجره نیز میتواند از شخصی به شخص دیگر منحصر به فرد باشد.
ترازِ صدا (صدای خارج شده از حنجره)
ترازِ صدای خارج شده از حنجره میتواند از زمزمه (subdued) تا فریاد(Shouting) متفاوت باشد. این تراز بهطور طبیعی از فـردی به فـردِ دیگر متفاوت است و اختصاصِ مقدار عددی به آن سـخـت است. مقادیرِ جدول1 بیانگر ترازِ متوسط صدای گفتار در فـرد بالغ است. قابلیت فهم گفتار، زمانی بهینه است که تراز گفتار از گفتار عادی در فاصله یکمتری(مطابق با جدول1) تبعیت کند.

بهعبارتِ دیگر، تراز فشار صدا در حدودِ 58 دسیبل(با مرجع 20 میلیپاسکال که آستانه شنوایی گوش انسان در هزار هرتز است) باشد.
طـیـفِ گفتار
اگر صدای خارج شده از حنجره(Voice) دارای مفهوم و قابل درک توسط انسان باشد، به آن گفتار (speech) میگویند. طیفِ گفتار، بخش بزرگی از کل گسترة بسامدیِ صـدا را پوشش میدهـد.گفتار(در زبانهای غربی و البته فارسی) با صداهایِ واکههـا(vowels) و همخوانها(consonants) شکل میگیرد. در زبانهای هندو اروپایی مانند پـارسی، شُش، منبع تولید صـدا است. منبع صدا جایی است که هوا را به جریان میانـدازد. در علم آواشناسی(Phonetics) برای رفتار شناسی و بررسیِ اثـرگـذاریِ بخشها و انـدامهای مختلف، دستگاه گفتار انسان را به دو بخش تقسیم میکنند: بخش اوّل: از شُش تا حنجره و بخش دوّم؛ از حنجره تا بیرون لبهـا.
صدای گفتارِ خارج شده از حنجره انسان، بهوسیلة تـار آواهـا (vocal chords) ایجاد میشود (بخش اوّل) و سپس تحت تاثیرِ تشدیدِ (resonances) حفرههایی قرار میگیرد که در مسـیـر عبورِ صدای گفتار وجود دارنـد(بخش دوّم).
سیگنالِ گفتار را میتوان با بسامد پایه و تعداد زیادی هماهنگ نیز تعریف کرد. نجوا(whisper) را نمیتوان جزء گفتار در نظر گرفت، اگرچه حفرههای تشدیدگرِ موجود در مسیر عبور هوای خارج شده، همچنان در شکلدهی به مصوتهای مختلف، نقش بـازی میکنند. از اینرو ممکن است؛ ویـژگیهای واکـههـا در پچپچ وجـود داشته بـاشـد.
بهطور کلی، مقدار میانگین (mean value) بسامد پایه – که نواک یا نیز گفته میشود – بینِ گستره 110 تا 130 هرتز برای آقایان و تقریباً یک هنگام بالاتر، از 200 تا 230 هرتز برای خانمهـا است. در هر دو مورد، ممکن است مقادیر، خارج از گسترههای ذکر شده باشند. برای بچهها بسامدِ پایه حوالیِ 300 هرتز است. انحرافِ خـاص از این گسترة بسامد پایه، در لحن و آوای زبانهایی مانندِ چینی بیشتر از زبانهای اروپایی مانند انگلیسی و آلمانی است. اگرچه، حالتِ گوینده نیز روی نواک اثرگذار است. همخوانهـا با انسدادِ هوا شکل داده میشوند و صداهای نویزی(noise sounds) با عبور هوا از گلو و دهان، بهویژه در زبان و لبها تولید میشوند. از نظر بسامدی، همخوانها اغلب در بسامدهای بالای 500 هرتز واقع میشوند.
در صدا با شدت عادی(normal vocal intensity)، بهطور معمول انرژی واکـههـا، به سرعت در بسامدهای بالای یک کیلوهرتز اُفت میکند. توجه داشته باشید؛ هنگامیکه صدای خارج شده از حنجره را بالاتر(بلندتر) ادا کنیم، طیفِ گفتار عادی، یک یا دو هنگام بهسوی بسامدهای بالاتر سوق مییابد. همچنین توجه داشته باشید که افزایش تـرازِ صـدا برای همخوانها به اندازة واکـههـا، ممکن نیست. پس با فرض نبودن نمونه زمینه، قابلیتِ فهم گفتار(intelligibility of speech) با فریاد زدن در مقایسه با صدای عادی افـزایش نمی یابد. دانستن این نکته نیز ارزشمند است که طیفِ گفتار هنگام ضبط، با تغییر فاصله و زاویه تغییر میکند.

با توجه به شکل 17، در پایینترین منحنی(صدای ملایم) تراز صدا در بسامد 500 هرتز حدود 45 دسیبل، در 1000 هرتز حدود 38 دسیبل، در 3000 هرتز حدودِ 32 دسیبل و در 5000 هرتز حدود 33 دسیبل است. در بالاترین منحنی، تراز صدا در بسامد 500 هرتز حدود 74 دسیبل، در 1000 هرتز حدود 78 دسیبل، در 3000 هرتز حدودِ 71 دسیبل و در 5000 هرتز حدود 62 دسیبل است. افزایش انرژی در فرکانسهای بالاتر( فرکانسهای میانی بین 1000 تا 3000) روی منحنیها قابل تشخیص است.(شکل18)

چـکـادهـا(Formants)
در بررسی آکوستیکی صدای انسان، به انرژی موجود در بسامدهای مختلفِ طیفِ صدای هر شخص توجه میشود. قلّه انرژی در اغلب صداها(بهخصوص واکـههـا) در بسامدهایِ خاصی از طیف سیگنال بروز میکند. این قـلّـههـا، شـیـوش(timbre) درکشده از طیفِ صدا را میسـازند. همانگونه که ترکیبِ هماهنگهای نُـتی، شیوش آن نت را میسازد. این قلهها را چکادها یا فرمنتها میگویند و واحد آن هم هـرتـز است. درواقع، چـکـادها، بسامدهایِ تشدیدِ دستگاه گفتار(Vocal Tracts) هستند.
اگر فردی به صدای دو یا چند نفر که در حال صحبت کردن یا آواز خواندن با واکه مشابه در نواکِ یکسان هستند، گوش دهد حتی اگر در شیوشِ این صداها تفاوت وجود داشته باشد احتمالاً در همه موارد، واکة درست، تشخیص داده میشود. با اثـرِ تشدید دستگاه گفتار و بینی (Vocal and nasal Tracts)روی سیگنالهای خارج شـده از تارهای صوتی، ویژگیهای خاص واکـههـا شکل میگیرد.(شکل19) حفرههای دستگاه گفتار مانند یک فیلتر آکوستیکی بر روی طیف صدای خروجی حنجره عمل میکند.نتیجه این فیلترها، تعدادی چکاد است: یعنی محدوههای بسامدی که بهطورِ خاصی برجستهاند.

این چکادهـا هستند که کم و بیش( بدون در نظر گرفتنِ نـواک صدای خارج شده از حنجره انسان) صدای واکهها را میسازند.(شکل20)
فرآیند شکلدهی به صدای واکهها، چیزی است که خودِ گوینده اساساً فراگرفته است و انجام میدهد. با این حال هر فرد به دلیل تفاوتهای کالبدشناختی، گفتاری با ویژگی خاص خود تولید میکند. این تفاوتها بهعلاوة پدیدههای دیگری چون آهنگِ بیان(intonation)، بخشی از آن چیزی است که باعثِ تمایز صدای فردی از فرد دیگر میشود.
در جدولِ2 میانگینِ بسامدها برای چکادهای اوّل و دوّم واکههای انگلیسی ارائه شده است. بسیاری از کلمات شکل ؟ در جدول 2 نیز قرار دارند.
