خانه / شماره‌های بسامد / بسامد104و105 / مقایسه صدای مبتنی برکانال Chanel based Audio(CBA) ،مبتنی بر صحنه (SBA) Scene baed Audio   و مبتنی بر شیء (OBA) Object based Audio در یک مثال

مقایسه صدای مبتنی برکانال Chanel based Audio(CBA) ،مبتنی بر صحنه (SBA) Scene baed Audio   و مبتنی بر شیء (OBA) Object based Audio در یک مثال

نویسنده: سارا محمودان

 

مقایسه صدای مبتنی برکانال Chanel based Audio(CBA) ،مبتنی بر صحنه (SBA) Scene baed Audio   و مبتنی بر شیء (OBA) Object based Audio در یک مثال:

در صدای مبتنی بر کانال ، هر کانال صوتی مستقیماً به بلنگوی معین در مکان خاص اختصاص می یابد.

مثلا در صدای استریوی دو کاناله، کانال چپ صدا به بلندگوی سمت چپ و کانال راست صدا به بلندگوی سمت راست، فرستاده می شود.  و یا در سیستم صدای فراگیر 5.1، کانالهای چپ، راست، مرکزی، LFE ، چپ فراگیر و راست فراگیر، هر کدام به بلندگوهای معین، اختصاص می یابند. و همیمطور در مورد صدای همه جانبه ی 22.2 به همین روال 24 سیگنال، مختص به 24 بلندگو وجود دارد.

در صدای مبتنی بر شیء، صداها به عنوان المان های جداگانه تعریف می شوند (مثلا صدای خواننده، درام و…) و اطلاعات موقعیتی هر شیء، در متادیتا به آن اضافه می شود. بنابراین می توان  هر کدام از المان ها را از مکان صحیح پخش کرد.

در صدای مبتنی بر صحنه مولفه های صوتیِ بُعد دار برای ایجاد یک میدان صوتی با هم ترکیب می شوند. Higher Order Ambisonic (HOA) اصلی ترین روشی است که در این مدل استفاده می شود. محتوای صوتی در SBA به صورت مجموعه ثابت از سیگنال های صوتی رمز نگاری می شود که تعداد آنها مستقل از تعداد عناصر صوتی است.

برای روشن تر شدن موضوع، این سه روش را در قالب یک مثال با هم مقایسه می کنیم:

فرض کنید دو برودکستر شماره 1 (فرانسوی) و شماره 2 (انگلیسی) قرار است مسابقه فوتبال را برای مخاطبین خود پخش کنند. امکان CBA ، OBA و SBA هم در خروجی کنسول میز صدا وجود دارد. حال ببینیم در انتخاب هر روش، چه اتفاقی می افتد.

الف- در حالت مبتنی بر کانال:

  • 1- در این روش متریال صدا (صدای میکروفن های زمین، گزارشگر و…) با هدف ارسال به آرایش معینِ بلندگوها با هم میکس می شوند. (مثلا 5.1 یا استریو)
  • 2- مخاطب برای دریافت تصویر مجازی صدایی که تولید کننده برایش در نظر گرفته است، باید بلندگوهای خود را مطابق با آرایش های معینِ مبتنی بر کانال، در مکان صحیح، مستقر کند.
  • 3- اگر تولید تنها بر اساس CBA انجام شود، مهندس صدا باید میکس های مختلفی با توجه به درخواست برودکستر انجام دهد:

1- مخاطب شماره 1 : سیستم 5.1 دارد اما به دلیل ملاحظات چینشِ منزل، موقعیت اسپیکرها برای آرایش 5.1 مناسب نیست و حتی اسپیکرهای L, R جلویی هم برای دریافت استریو مناسب نیست. بنابراین شنونده محتوا را متفاوت از آنچه هدف تولید کننده است، دریافت می کند و تجربه شنیداری مناسبی نخواهد داشت.

2- مخاطب شماره 2: سیستم استریو دارد. مخاطب انگلیسی زبان است اما از برودکستر فرانسوی سرویس می گیرد. و چون امکان انتخاب زبان برای او وجود ندارد، باز هم تجربه شنیداری رضایت بخشی نخواهد داشت.

با توجه به سناریوی مطرح شده، چرا CBA به تنهایی نمی تواند انتخاب خوبی در NGA باشد؟

  • زبان های متعدد به چندین میکس جداگانه نیاز دارد که تولید آن پرهزینه است و به محدودیت در پهنای باند، انتشار همزمان چندین میکس بصورت هم زمان را غیر ممکن می سازد.
  • قابلیت شخص سازی ندارد. به عنوان مثال کاربر نمی تواند صدای گزارشگر را نسبت به آمبیانس یا M& E (موسیقی و افکت) افزایش دهد تا قابلیت فهم گفتار افزایش یابد.
  • رندرینگ انعطاف پذیر نیست؛ به این معنی که اگر آرایش بلندگوهای کاربر، با آنچه در میکس مدنظر تولیدکننده ی محتوا بوده، مطابقت نداشته باشد، نتیجه ی شنیداری مخاطب مطلوب نخواهد بود.

ب- در حالت مبتنی بر شیء:

1- در این روش متریال صدا (صدای میکروفن های زمین، گزارشگر و…) به صورت مولفه های مجزا (میکس نشده) که به آن ها Object گفته می شود، همراه با متادیتای مربوطه ارسال می شود.

* متادیتا شامل ازاطلاعاتی است که شیء صوتی را توصیف می کند. مانند موقعیت مکانی و یا تراز صدا

2- در گیرنده رندرینگ تلاش می کند  تا object های صدا را بر مبنای آرایش بلندگوهای موجود – که ممکن است استاندارد هم نباشد- بازتولید کند.

3- مهندس صدا لازم نیست میکس های مختلفی با توجه به درخواست برودکستر انجام دهد زیرا امکان شخصی سازی و تعاملی برای کاربر فراهم است. از جمله امکان سفارشی کردن تراز صدای نسبی گفتگو و M&E  یا انتخاب زبان دلخواه

باند موسیقی و افکت (M&E) در روش مبتنی بر شیء

  • پهنای باند مورد نیاز برای انتقال object  های مجزا و همچنین پیچیدگی دیکد کردن آنها با افزایش تعداد object ها افزایش می یابد. چنانچه M&E با روش مبتنی بر کانال، ارسال شود، اکثر برنامه ها تعداد object های صوتی زیادی نخواهند داشت. مگر مواردی مانند محتوای اپیزودیک یا VR
  • در این روش، اغلب M&E مانند CBA برای آرایش معین بلندگوها تولید می شود(مثلا 5.1) ؛ از این رو متکی به فرمت CBA است. چنانچه چینش بلندگوهای کاربر مطابق استانداردِ تولید نباشد، پردازش های اضافه تر نیاز است تا محتوای تولید شده را با چینش موجود تطابق دهد. (آپ-میکس یا دان-میکس). در این صورت، تمام اشکالات CBA بر آن وارد است.
  • M&E را می توان به عنوان Object  تحویل داد. در این صورت رندرینگ قابل انعطاف OBA می تواند بر همه مشکلات مربوط به CBA M&E غلبه کند. اما به دلیل مصرف پهنای باند زیاد برای انتقال object های صوتی متعدد، در بسیاری از برنامه ها کاربردی نیست.

ترکیب دو روش CBA و OBA به شکل زیر است:

ج- حالت مبتنی بر صحنه:

  • 1- مخاطب شماره 1 : سیستم 5.1 دارد اما به دلیل ملاحظات چینشِ منزل، موقعیت اسپیکرها برای آرایش 5.1 مناسب نیست اما در این روش، از رندرینگ انعطاف پذیر HOA بهره می برد و بنابراین شنونده محتوا را مطابق با آنچه هدف تولید کننده است، دریافت می کند و تجربه شنیداری مناسبی خواهد داشت.

2- مخاطب شماره 2: سیستم استریو دارد. مخاطب انگلیسی زبان است اما از برودکستر فرانسوی سرویس می گیرد. اما امکان انتخاب زبان برای او وجود ندارد و تجربه شنیداری رضایت بخشی نخواهد داشت.

بنابراین هر فرمت صوتی هنگام اجرا درNGA  مزایا و معایب خاص خود را دارد. بهتر است از ترکیبی از قالبها برای اهداف NGA  استفاده شود، به طورخاص، بهترین ترکیب قالبهایی که تمام مشکلات ذکر شده در بالا را حل می کنند، ترکیب OBA با SBA است. این گزینه توسط استاندارد صوتی MPEG-H  کاملاً پشتیبانی می شود.

 

پاسخ دهید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *