مقدمه :
این توانایی در انسان وجود دارد که صداهای محیطی را به بهترین وجه ممکن بشنود.
به عنوان مثال از اولین کارهایی که یک نوزاد انجام میدهد این است که بسیار سریع و هوشمندانه سر خود را در جهت منابع صدا میچرخاند و مکان یابی را به بهترین نحو ممکن انجام میدهد.
در واقع ساختار کانال گوش-مغز و مسیر و جهت رسیدن صوت به لاله گوش این قابلیت را به انسان داده است. با استفاده از این ویژگی میتوان مخاطب را به اعماق یک فیلم برد و او را به اوج هیجان رساند. در ادامه خواهیم گفت که بشر همواره سعی کرده است، تا از این ویژگیها برای بهبود کیفیت تجربة شنیداری خود استفاده کند.
مونو(Mono)یکی از فنآوریهای پرکاربردی که هم اکنون استفاده آن بسیار کم شده، فنآوری صدای مونو است. در این روش همة صداها از طریق یک کانال صوتی برای پخش ارسال میشوند. یعنی وقتی که با هدفون به یک صدای مونوی دوکاناله گوش میدهید هر آنچه از گوش چپ میشنوید از گوش راست نیز خواهید شنید.
استریو(Stereo)
بعد از مونو فنآوری استریو -که از دو کانال برای پخش استفاده میکند- به وجود آمد. به وسیله استریو شما میتوانید تشخیص دهید صدا از چپ و یا از راست است. ولی جهت بالا و پایین و یا جلو یا پشت سر را نمیتوانید تشخیص دهید. به عنوان مثال وقتی به یک موسیقی در حالت استریو گوش میدهید میتوانید احساس کنید یک ساز در سمت چپ و ساز دیگری در سمت راست نواخته میشود.
فراگیر(Surround)
بعدها شرکتهایی چون dolby,dts ,… از صدای فراگیر برای اهداف تجاری خود استفاده کردند. در این فنآوری متخصصان در استودیو میتوانند با ترکیب چندکانال صوتی با استفاده از پردازشهای رایانهای صدای فراگیر درست کنند. اما در سمت گیرنده نیز باید سیستم پخش کننده مناسب وجود داشته باشد، مانند سیستم ۵٫۱ یا ۷٫۱ یا حتی ۲۱٫۱٫ همه این موارد به گیرنده بستگی دارد که از چند بلندگو و به چه شکلی استفاده کند.
دوگوشی(Binaural)
این فرمت، یک فرمت واقعی صدای سه بُعدی است و نسبت به surround برای مخاطبان در دسترستر است. زیرا به سادگی با هدفون قابل شنیدن است و مانند صدای فراگیر نیاز به تعداد زیادی بلندگو ندارد. هرچند تولید آن به مراتب پیچیدهتر و هزینهبرتر از صدای فراگیر است.
در این روش صدا به همان صورتی که در واقعیت شنیده میشود، توسط میکروفونهای binaural ضبط میشوند که در یک سر مجازی (dummy head) قرار داده شدهاند.
در واقع سرمجازی و میکروفونها به گونهای طراحی شدهاند که بیشترین شباهت به سر و سیستم شنوایی انسان داشته باشند تا نحوه شنیدن صدا توسط شنونده و تاثیرات بازتاب صدا از اجزاء مختلف سر و رسیدن آن به گوش انسان به بهترین وجه ممکن شبیهسازی شود.
در سمت گیرنده نیز با یک هدفون دو کاناله معمولی نیز میتوان صدای دوگوشی (binaural) راشنید.
در واقع در این روش، به جای افزودن کانالهای صوتی در سمت شنونده و شبیهسازی منابع صدا میتوان نحوه شنیدن انسان در محل ضبط صدا را شبیهسازی کرد و همان گونه که انسان صدا را میشنود، صدا را ضبط کرد.
صدای همهجانبه(Immersive sound)
صنعت سینمایی به تدریج از صدای مونو به سمت صدای استریو حرکت کرد تا شنوندگان احساس بهتری از حرکت صدا داشته باشند. برای تعریف صدای ایمرسیو بهتر است در ابتدا میدان صوتی(Sound Field) را تعریف کنیم. بر این اساس فضای آکوستیکی ایجاد شده توسط یک یا چند مبنع صوتی(به طور همزمان) را میدان صوتی میگویند. میدان صوتی مرسوم و قدیمی، میدانی دو بعدی در یک صفحه افقی(همتراز با گوش شنونده) است که به آن Base Layer یا Surround Layer میگویند. با افزودن لایههای دیگر میدان صوتی (Height Layer و Top Layer ) به میدان صوتی مرسوم(Base Layer ) درک عمیقتری از احساس ارتفاع برای شنوندگان فراهم میشود و صدایی طبیعی و نزدیک به سه بُعدی مهیا میشود که به آن Immersive میگویند. این اصطلاح به جای صدای فراگیر ارتفاعی(Height surround) به کار گرفته شده است.
Base layer : تمامی میدانهای صوتی قدیمی در صفحه افقی قرار دارند که به آنbase layer گویند.
Height layer : لایهای که روی دیوارهها و بر رویbase layer قرار دارد.
Top layer: لایهای که بر روی سقف و روی سر شنوندگان قرار میگیرد.
از موثرترین روشها برای تولید immersive audio روشهای channel base و object base است که میتواند درک عمیقتری از احساس ارتفاع را برای شنوندگان فراهم کند.
سادهترین راه برای دستیابی به این امر، افزایش تعداد کانالها (channel base) است. این کانالها در بالای سر شنوندگان و اطراف آنان قرار میگیرند.
روش channel base با افزایش تعداد کانالهای صوتی میسر میشود و تولید کننده باید محتوای خود را متناسب با یک طرح بلندگوی خاص و از پیش تعیین شده تولید کند. در این روش هر کانال به مکان ثابت برای پخش هدایت میشود. برای مثال در استریو کانالL به بلندگوی سمت چپ و کانالR به بلندگوی سمت راست هدایت میشود.
از آنجایی که فنآوری channel base تولیدکنندگان را به تولید محتوا برای چیدمانی خاص از بلندگوها وادار میکرد، روش object base پا به عرصه گذاشت. موضوعات صوتی(Audio Objects) جلوههای صوتی هستند که به یک کانال واحد مرتبط نیستند و میتوانند اطراف محل شنوایی، بر اساس پیکربندی فیزیکی بلندگوها حرکت کنند. این امر با افزودن متادیتا به دادههای صوتی امکانپذیر است.
هدف ما رساندن محتوای خلاقانه تولیدکننده به دست مخاطب، به گونهای است که متناسب با تجهیزات خود بهترین صدای ممکن را دریافت کند. در فنآوری object Base به کاربرنهایی کمک میشود تا با توجه به دسترسی خود و ویژگیهای پلتفرم پخش و محیط، بهترین تنظیمات را انجام دهد. علاوه بر این برای تولیدکننده نیز بسیار سودمند خواهد بود، زیرا گردش کارها میتواند بسیار ساده باشد و فقط یک بسته واحد ایجاد، بایگانی و منتقل شود تا بسیاری از دستگاهها و محیطها را پشتیبانی کند. به این ترتیب چهار ویژگی کلیدی برای رسانه یعنی تعامل و شخصی سازی، دسترسی، تجربة همه جانبه و سازگاری حفظ میشود. اما این روش نیاز به پردازشهای پیچیدهتری دارد که متناسب است با تعداد بلندگوهایی که به طور مستقیم آدرسدهی میشوند.
ترکیب channel base و object base بهترین گزینه است. این روش توسط Dolby با معرفی Atmos در سال ۲۰۱۲ ارائه شد و سپس با Barco’s Auro Max در سال ۲۰۱۵ ادامه یافت.
صفحه ۷ نشریه تخصصی بسامد شماره ۷۸