خانه / صدا / انواع سیگنال در مهندسی صـدا(بخش چهارم)

انواع سیگنال در مهندسی صـدا(بخش چهارم)

نویسنده: سارا محمودان

صدای حنجره(Voice)  به عنوان منبع صـدا

درکِ ویژگی‌های صدایِ خارج شده از حنجره مهم است. در حالی که زبان می‌تواند وجه مشترک گروهی از مردم باشد، سرشت و صدای حنجره نیز می‌تواند از شخصی به شخص دیگر منحصر به ‌فرد باشد.

ترازِ صدا (صدای خارج ‌شده از حنجره)

ترازِ صدای خارج شده از حنجره می‌تواند از زمزمه (subdued) تا فریاد(Shouting) متفاوت باشد. این تراز به‌طور طبیعی از فـردی به فـردِ دیگر  متفاوت است و اختصاصِ مقدار عددی به آن سـخـت است. مقادیرِ جدول۱ بیانگر ترازِ متوسط صدای گفتار در فـرد بالغ است. قابلیت فهم گفتار، زمانی بهینه است که تراز گفتار از گفتار عادی در فاصله یک‌متری(مطابق با جدول۱) تبعیت کند.

جدول ۱) تراز متوسط گفتار به‌عنوان تابعی از فاصله شنونده/ ضبط‌کننده به‌طور تقریبی، بین گفتار عادی تا فریاد حدود ۲۰ دسی‌بل تفاوت وجود دارد.

به‌عبارتِ دیگر، تراز فشار صدا در حدودِ ۵۸‌ دسی‌بل(با مرجع ۲۰ میلی‌پاسکال که آستانه شنوایی گوش انسان در هزار هرتز است) باشد.

طـیـفِ گفتار

اگر صدای خارج شده از حنجره(Voice) دارای مفهوم و قابل درک توسط انسان باشد، به آن گفتار (speech)  می‌گویند. طیفِ گفتار، بخش بزرگی از کل گسترة بسامدیِ صـدا را پوشش می‌دهـد.گفتار(در زبان‌های غربی و البته فارسی) با صداهایِ واکه‌هـا(vowels)  و هم‌خوان‌ها(consonants) شکل می‌گیرد. در زبان‌های هندو اروپایی مانند پـارسی، شُش، منبع تولید صـدا است. منبع صدا جایی است که هوا را به جریان می‌انـدازد. در علم آواشناسی(Phonetics) برای رفتار شناسی و بررسیِ اثـرگـذاریِ بخش‌ها و انـدام‌های مختلف، دستگاه گفتار انسان را به دو بخش تقسیم می‌کنند: بخش اوّل: از شُش تا حنجره و بخش دوّم؛ از حنجره تا بیرون لب‌هـا.

صدای گفتارِ خارج شده از حنجره انسان، به‌وسیلة تـار آواهـا (vocal chords)  ایجاد می‌شود (بخش اوّل) و سپس تحت تاثیرِ تشدیدِ (resonances)  حفره‌هایی قرار می‌گیرد که در مسـیـر عبورِ صدای گفتار وجود دارنـد(بخش دوّم).

سیگنالِ گفتار را می‌توان با بسامد پایه و تعداد زیادی هماهنگ نیز تعریف کرد. نجوا(whisper) را نمی‌توان جزء گفتار در نظر گرفت، اگرچه حفره‌های تشدیدگرِ موجود در مسیر عبور هوای خارج شده، همچنان در شکل‌دهی به مصوت‌های مختلف، نقش بـازی می‌کنند. از این‌رو ممکن است؛ ویـژگی‌های واکـه‌هـا در پچ‌پچ وجـود داشته بـاشـد.

به‌طور کلی، مقدار میانگین (mean value)  بسامد پایه – که نواک یا  نیز گفته می‌شود – بینِ گستره ۱۱۰ تا ۱۳۰ هرتز برای آقایان و تقریباً یک هنگام بالاتر، از ۲۰۰ تا ۲۳۰ هرتز برای خانم‌هـا است. در هر دو مورد، ممکن است مقادیر، خارج از گستره‌های ذکر شده باشند. برای بچه‌ها بسامدِ پایه حوالیِ ۳۰۰ هرتز است. انحرافِ خـاص از این گسترة بسامد پایه، در لحن و آوای زبان‌هایی مانندِ چینی بیشتر از زبان‌های اروپایی مانند انگلیسی و آلمانی است. اگرچه، حالتِ گوینده نیز روی نواک اثرگذار است. هم‌خوان‌هـا با انسدادِ هوا شکل داده می‌شوند و صداهای نویزی(noise sounds) با عبور هوا از گلو و دهان، به‌ویژه در زبان‌ و لب‌ها تولید می‌شوند. از نظر بسامدی، هم‌خوان‌ها اغلب در بسامد‌های بالای ۵۰۰ هرتز واقع می‌شوند.

در صدا با شدت عادی(normal vocal intensity)، به‌طور معمول انرژی واکـه‌هـا، به‌ سرعت در بسامدهای بالای یک کیلوهرتز اُفت می‌کند. توجه داشته باشید؛ هنگامی‌که صدای خارج شده از حنجره را بالاتر(بلندتر) ادا کنیم، طیفِ گفتار عادی، یک یا دو هنگام به‌سوی بسامدهای بالاتر سوق می‌یابد. همچنین توجه داشته باشید که افزایش تـرازِ صـدا برای هم‌خوان‌ها به اندازة واکـه‌هـا، ممکن نیست. پس با فرض نبودن نمونه زمینه، قابلیتِ فهم گفتار(intelligibility of speech) با فریاد زدن در مقایسه با صدای عادی افـزایش نمی یابد. دانستن این نکته نیز ارزشمند است که طیفِ گفتار هنگام ضبط، با تغییر فاصله و زاویه تغییر می‌‌کند.

شکل۱۷) صدای مـرد: میانگینِ طیف یک-سومِ هنگامی برای ترازهای گفتار متفاوت. توجه کنید، هنگامی که تراز صدای گفتار به تدریج افزایش می‌یـابـد، انرژی به سوی بسامدهای بالاتر حرکت می‌کند.

با توجه به شکل ۱۷، در پایین‌ترین منحنی(صدای ملایم) تراز صدا در بسامد ۵۰۰ هرتز حدود ۴۵ دسی‌بل، در ۱۰۰۰ هرتز حدود ۳۸ دسی‌بل، در ۳۰۰۰ هرتز حدودِ ۳۲ دسی‌بل و در ۵۰۰۰ هرتز حدود ۳۳ دسی‌بل است. در بالاترین منحنی، تراز صدا در بسامد ۵۰۰ هرتز حدود ۷۴ دسی‌بل، در ۱۰۰۰ هرتز حدود ۷۸ دسی‌بل، در ۳۰۰۰ هرتز حدودِ ۷۱ دسی‌بل و در ۵۰۰۰ هرتز حدود ۶۲ دسی‌بل است. افزایش انرژی در فرکانس‌های بالاتر( فرکانس‌های میانی بین ۱۰۰۰ تا ۳۰۰۰) روی منحنی‌ها قابل تشخیص است.(شکل۱۸)

شکل ۱۸) صدای زن: میانگینِ طیف یک-سومِ هنگامی برای ترازهای گفتار متفاوت.

چـکـادهـا(Formants)

در بررسی آکوستیکی صدای انسان، به انرژی موجود در بسامدهای مختلفِ طیفِ صدای هر شخص توجه می‌شود. قلّه انرژی در اغلب صداها(به‌خصوص واکـه‌هـا) در بسامدهایِ خاصی از طیف سیگنال بروز می‌کند. این قـلّـه‌هـا، شـیـوش(timbre) درک‌شده از طیفِ صدا را می‌سـازند. همان‌گونه که ترکیبِ هماهنگ‌های نُـتی، شیوش آن نت را می‌سازد. این قله‌ها را چکادها یا فرمنت‌ها می‌گویند و واحد آن هم هـرتـز است. درواقع، چـکـادها، بسامدهایِ تشدیدِ دستگاه گفتار(Vocal Tracts) هستند.

اگر فردی به صدای دو یا چند نفر که در حال صحبت کردن یا آواز خواندن با واکه مشابه در نواکِ  یکسان هستند، گوش دهد حتی اگر در شیوشِ این صداها تفاوت وجود داشته باشد احتمالاً در همه موارد، واکة درست، تشخیص داده می‌شود. با اثـرِ تشدید دستگاه گفتار و بینی     (Vocal and nasal Tracts)روی سیگنال‌های خارج شـده از تارهای صوتی، ویژگی‌های خاص واکـه‌هـا شکل می‌گیرد.(شکل۱۹) حفره‌های دستگاه گفتار مانند یک فیلتر آکوستیکی بر روی طیف صدای خروجی حنجره عمل می‌کند.نتیجه این فیلترها، تعدادی چکاد است: یعنی محدوه‌های بسامدی که به‌طورِ خاصی برجسته‌اند.

شکل ۱۹) موقعیت زبان در اینجا برای ۴ واکة زبان انگلیسی نشان داده شده است.

این چکادهـا هستند که کم و بیش( بدون در نظر گرفتنِ نـواک صدای خارج شده از حنجره انسان) صدای واکه‌ها را می‌سازند.(شکل۲۰)

فرآیند شکل‌دهی به صدای واکه‌ها، چیزی است که خودِ گوینده اساساً فراگرفته است و انجام می‌دهد.  با این حال هر فرد به دلیل تفاوت‌های کالبدشناختی، گفتاری با ویژگی خاص خود تولید می‌کند.  این تفاوت‌ها به‌علاوة پدیده‌های دیگری چون آهنگِ بیان(intonation)، بخشی از آن چیزی است که باعثِ تمایز صدای فردی از فرد دیگر می‌شود.

در جدولِ۲ میانگینِ بسامدها برای چکادهای اوّل و دوّم واکه‌های انگلیسی ارائه شده است. بسیاری از کلمات شکل ؟ در جدول ۲ نیز قرار دارند.

شکل۲۰) محدودة بسامدی چکادها برای واکه‌های مختلف در زبانِ انگلیسی. چکادها از پایین (پایین‌ترین بسامد) به صورتِ اوّلین چکاد، دوّمین چکاد و سومین چکاد مشخص شده است.

جدول ۲) میانگینِ بسامدها برای چکادهای اوّل و دوّم واکه‌های انگلیسی

 

 

حتما ببینید

راهنمای تنظیمات مانیتور صدا (بخش ا)

سارا محمودان مانیتور چیست؟      پیش از تعریف مانیتورینگ صدا، بهتر است به تفاوت دو …

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *