خانه / صدا / صدای Immersive

صدای Immersive

نویسنده: محمد حسین افشاری پور

مقدمه :

این توانایی در انسان وجود دارد که صداهای محیطی را به بهترین وجه ممکن بشنود.

به عنوان مثال از اولین کارهایی که یک نوزاد انجام می‌دهد این است که بسیار سریع و هوشمندانه سر خود را در جهت منابع صدا می‌چرخاند و مکان یابی را به بهترین نحو ممکن انجام می‌دهد.

در واقع ساختار کانال گوش-مغز و مسیر و جهت رسیدن صوت به لاله گوش این قابلیت را به انسان داده است. با استفاده از این ویژگی می‌توان مخاطب را به اعماق یک فیلم برد و او را به اوج هیجان رساند. در ادامه خواهیم گفت که بشر همواره سعی کرده است، تا از این ویژگی‌ها برای بهبود کیفیت تجربة شنیداری خود استفاده کند.

مونو(Mono)یکی از فن‌آوری‌های پرکاربردی که هم اکنون استفاده آن بسیار کم شده، فن‌آوری‌ صدای مونو است. در این روش همة صداها از طریق یک کانال صوتی برای پخش ارسال می‌شوند. یعنی وقتی که با هدفون به یک صدای مونوی دوکاناله گوش می‌دهید هر آنچه از گوش چپ می‌شنوید از گوش راست نیز خواهید شنید.

استریو(Stereo)
بعد از مونو فن‌آوری‌ استریو -که از دو کانال برای پخش استفاده می‌کند- به وجود آمد. به وسیله استریو شما می‌توانید تشخیص دهید صدا از چپ و یا از راست است. ولی جهت بالا و پایین و یا جلو یا پشت سر را نمی‌توانید تشخیص دهید. به عنوان مثال وقتی به یک موسیقی در حالت استریو گوش می‌دهید می‌توانید احساس کنید یک ساز در سمت چپ و ساز دیگری در سمت راست نواخته می‌شود.

                        Dummy Head

فراگیر(Surround)
بعدها شرکت‌هایی چون dolby,dts ,… از صدای فراگیر برای اهداف تجاری خود استفاده کردند. در این فن‌آوری‌ متخصصان در استودیو می‌توانند با ترکیب چندکانال صوتی با استفاده از پردازش‌های رایانه‌ای صدای فراگیر درست کنند. اما در سمت گیرنده نیز باید سیستم پخش کننده مناسب وجود داشته باشد، مانند سیستم ۵٫۱ یا ۷٫۱ یا حتی ۲۱٫۱٫ همه این موارد به گیرنده‌ بستگی دارد که از چند بلندگو و به چه شکلی استفاده کند.

دوگوشی(Binaural)
این فرمت، یک فرمت واقعی صدای سه بُعدی است و نسبت به surround برای مخاطبان در دسترس‌تر است. زیرا به سادگی با هدفون قابل شنیدن است و مانند صدای فراگیر نیاز به تعداد زیادی بلندگو ندارد. هرچند تولید آن به مراتب پیچیده‌تر و هزینه‌برتر از صدای فراگیر است.
در این روش صدا به همان صورتی که در واقعیت شنیده می‌شود، توسط میکروفون‌های binaural ضبط می‌شوند که در یک سر مجازی (dummy head) قرار داده شده‌اند.

در واقع سرمجازی و میکروفون‌ها به گونه‌ای طراحی شده‌اند که بیشترین شباهت به سر و سیستم شنوایی انسان داشته باشند تا نحوه شنیدن صدا توسط شنونده و تاثیرات بازتاب صدا از اجزاء مختلف سر و رسیدن آن به گوش انسان به بهترین وجه ممکن شبیه‌سازی شود.
در سمت گیرنده نیز با یک هدفون دو کاناله معمولی نیز می‌توان صدای دوگوشی (binaural) راشنید.

در واقع در این روش، به جای افزودن کانال‌های صوتی در سمت شنونده و شبیه‌سازی منابع صدا می‌توان نحوه شنیدن انسان در محل ضبط صدا را شبیه‌سازی کرد و همان گونه که انسان صدا را می‌شنود، صدا را ضبط کرد.

صدای همه‌جانبه(Immersive sound)
صنعت سینمایی به تدریج از صدای مونو به سمت صدای استریو حرکت کرد تا شنوندگان احساس بهتری از حرکت صدا داشته باشند. برای تعریف صدای ایمرسیو بهتر است در ابتدا میدان صوتی(Sound Field) را تعریف کنیم. بر این اساس فضای آکوستیکی ایجاد شده توسط یک یا چند مبنع صوتی(به طور همزمان) را میدان صوتی می‌گویند. میدان صوتی مرسوم و قدیمی، میدانی دو بعدی در یک صفحه افقی(هم‌تراز با گوش شنونده) است که به آن Base Layer یا Surround Layer می‌گویند. با افزودن لایه‌های دیگر میدان صوتی (Height Layer و Top Layer ) به میدان صوتی مرسوم(Base Layer ) درک عمیق‌تری از احساس ارتفاع برای شنوندگان فراهم می‌شود و صدایی طبیعی و نزدیک به سه بُعدی مهیا می‌شود که به آن Immersive می‌گویند. این اصطلاح به جای صدای فراگیر ارتفاعی(Height surround) به کار گرفته شده است.

Base layer : تمامی میدان‌های صوتی قدیمی در صفحه افقی قرار دارند که به آنbase layer گویند.
Height layer : لایه‌ای که روی دیواره‌ها و بر رویbase layer قرار دارد.
Top layer: لایه‌ای که بر روی سقف و روی سر شنوندگان قرار می‌گیرد.

از موثرترین روش‌ها برای تولید immersive audio روش‌های channel base و object base است که می‌تواند درک عمیق‌تری از احساس ارتفاع را برای شنوندگان فراهم کند.


ساده‌ترین راه برای دستیابی به این امر، افزایش تعداد کانال‌ها (channel base) است. این کانال‌ها در بالای سر شنوندگان و اطراف آنان قرار می‌گیرند.
روش channel base با افزایش تعداد کانال‌های صوتی میسر می‌شود و تولید کننده باید محتوای خود را متناسب با یک طرح بلندگوی خاص و از پیش تعیین شده تولید کند. در این روش هر کانال به مکان ثابت برای پخش هدایت می‌شود. برای مثال در استریو کانالL به بلندگوی سمت چپ و کانالR به بلندگوی سمت راست هدایت می‌شود.

از آنجایی که فن‌آوری channel base تولید‌کنندگان را به تولید محتوا برای چیدمانی خاص از بلندگوها وادار می‌کرد، روش object base پا به عرصه گذاشت. موضوعات صوتی(Audio Objects) جلوه‌های صوتی هستند که به یک کانال واحد مرتبط نیستند و می‌توانند اطراف محل شنوایی، بر اساس پیکربندی فیزیکی بلندگوها حرکت کنند. این امر با افزودن متادیتا به داده‌های صوتی امکان‌پذیر است.


هدف ما رساندن محتوای خلاقانه تولید‌کننده به دست مخاطب، به گونه‌ای است که متناسب با تجهیزات خود بهترین صدای ممکن را دریافت کند. در فن‌آوری object Base به کاربرنهایی کمک می‌شود تا با توجه به دسترسی خود و ویژگی‌های پلتفرم پخش و محیط، بهترین تنظیمات را انجام دهد. علاوه بر این برای تولید‌کننده نیز بسیار سودمند خواهد بود، زیرا گردش کارها می‌تواند بسیار ساده باشد و فقط یک بسته واحد ایجاد، بایگانی و منتقل شود تا بسیاری از دستگاه‌ها و محیط‌ها را پشتیبانی کند. به این ترتیب چهار ویژگی کلیدی برای رسانه یعنی تعامل و شخصی سازی، دسترسی، تجربة همه جانبه و سازگاری حفظ می‌شود. اما این روش نیاز به پردازش‌های پیچیده‌تری دارد که متناسب است با تعداد بلندگوهایی که به طور مستقیم آدرس‌دهی می‌شوند.
ترکیب channel base و object base بهترین گزینه است. این روش توسط Dolby با معرفی Atmos در سال ۲۰۱۲ ارائه شد و سپس با Barco’s Auro Max در سال ۲۰۱۵ ادامه یافت.

صفحه ۷ نشریه تخصصی بسامد شماره ۷۸

حتما ببینید

فراموشی شماره میکروفن

چالش فراموشی شماره میکروفن در برنامه های با تعداد میکروفن زیاد  نویسنده: مهندس فرزین شعبانی …

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *