مهندسی صدا ، شنوایی و امواج صوتی

اطلاعات زير مي تواند کمک بزرگ در درک بيشتر مسائل مربوط به ميکس و مسترينگ کند.

دستگاه شنوايي انسان

پردازش صوت محدوده‌هاي گوناگوني را در بر مي‌گيرد كه همه به منظور ارائة صدا به شنوندگان انساني ابداع شده‌اند. سه محدودة تكثير موسيقي با كيفيتي به خوبي اصل همانند آنچه در سي‌دي‌هاي صوتي وجود دارد ،ارتباط صوتي از راه دور كه نام ديگر شبكة تلفني است و ،تركيب صحبت كه در آن كامپيوترها الگوهاي صوتي انسان را توليد كرده يا تشخيص مي‌دهند از ديگر قلمروهاي دانش پردازش صوت مهم‌ترند. با وجود اين كه اهداف و مسائل اين كاربردها متفاوتند همگي در يك نقطة مشترك به هم مي‌رسند و آن گوش انسان است.

گوش انسان يك عضو به گونه‌اي فزاينده پيچيده است. قضيه وقتي پيچيده‌تر مي‌شود كه اطلاعات ارسالي از دو گوش در يك شبكة پيچيدة گيج كننده كه همانا مغز انسان باشد با هم تركيب مي‌شوند. به ياد داشته باشيم كه بيان فوق يك گذر كلي بر قضيه است و تعداد زيادي از پديده‌ها و آثار دقيق مرتبط با گوش انسان هنوز به درستي درك نشده‌اند.

شكل 1 قسمت اعظم ساختارها و پردازشهايي را كه گوش انسان را در بر دارند به تصوير مي‌كشد. گوش خارجي از دو بخش تشكيل شده است: نرمي پوست قابل مشاهده و غضروف متصل به كنار سر و كانال گوش كه لوله‌ايست به قطر تقريبي 0.5 سانتيمتر و تا حدود 3 سانتيمتر در داخل سر فرو مي‌رود. اين ساختارها صداهاي محيط را به بخشهاي حساس گوش مياني و گوش داخلي كه در درون استخوانهاي جمجمه محافظت مي‌شود راهبري مي‌كنند. در انتهاي كانال گوش يك ورقة نازك از نسوج كه پردة صماخ يا طبل گوش ناميده مي‌شود كشيده شده است. امواج صدا با برخورد به پردة صماخ باعث لرزش آن مي‌شوند. گوش مياني مجموعه‌اي از استخوانهاي كوچك است كه لرزش مزبور را به حلزون گوش (گوش داخلي) انتقال مي‌دهند و در آنجا اين لرزشها تبديل به ضربه‌هاي عصبي مي‌گردند. حلزون گوش يك لولة پر از مايع است كه به زحمت قطر آن به 2 ميليمتر و طول آن به 3 سانتيمتر مي‌رسد. اگر چه حلزون گوش در شكل شمارة 1 به صورت يك لولة مستقيم نشان داده شده اما در واقع به دور خودش همانند صدف حلزون پيچ خورده است و وجه تسمية آن كه ريشه در كلمه‌اي يوناني به معناي حلزون دارد نيز اين واقعيت است.

وقتي يك موج صوتي سعي دارد از هوا وارد مايع شود تنها كسر كوچكي از آن از بين دو محيط عبور مي‌كند و باقيماندة انرژي آن بازتابيده مي‌شود. دليل اين امر مقاومت مكانيكي پايين هوا (ناشي از پايين بودن ميزان فشار صوتي و سرعت بالاي ذرات هوا كه به نوبة خود از چگالي پايين و تراكم‌پذيري بالاي آنها نشأت مي‌گيرد) در برابر مقاومت مكانيكي بالاي مايع است. به عبارت ساده‌تر دليل اين امر مشابه دليل اين موضوع است كه براي ايجاد موج با دست در درون آب به تلاش بيشتري به نسبت انجام اين كار در هوا نيازمنديم. تفاوت موجود باعث بازتابش قسمت اعظم صوت در مرز هوا/مايع مي‌گردد.

گوش مياني يك شبكة تطبيق مقاومت است كه كسر انرژي صوتي وارد شده به مايع گوش داخلي را زياد مي‌كند. براي نمونه ماهي پردة صماخ يا گوش مياني ندارد چرا كه نيازي به شنيدن در هوا ندارد. تغيير شدت، بيشتر ناشي از تفاوت مساحت پردة صماخ (كه صدا را از هوا دريافت مي‌كند) و دريچه بيضوي (كه مطابق شكل 1صدا را به داخل مايع انتقال مي‌دهد) مي‌باشد. مساحت پردة صماخ حدوداً 60 ميليمتر مربع است حال آن كه دريچة بيضوي حدوداً 4 ميليمتر مربع مساحت دارد. از آنجا كه فشار برابر است با نسبت نيرو به مساحت، اين تفاوت مساحت فشار موج صدا را حدوداً 15 برابر افزايش مي‌دهد.

در داخل حلزون گوش پردة اصلي قرار دارد كه ساختاري را براي 12000 سلول حسي كه شكل‌دهندة عصب حلزوني است ايجاد مي‌كند. پردة اصلي در نزديكي دريچة بيضوي بسيار سفت است و در انتهاي ديگر انعطاف‌پذير‌تر است كه اين امر به اين عضو كمك مي‌كند تا به عنوان تحليلگر طيف فركانسي عمل كند. وقتي پردة اصلي در معرض يك سيگنال با فركانس بالا قرار مي‌گيرد در قسمت سفت‌تر طنين مي‌اندازد كه سبب تحريك سلولهاي عصبي نزديك به دريچة بيضوي مي‌گردد. به همين ترتيب فركانسهاي پايين موجب تحريك انتهاي دورتر پردة اصلي مي‌شوند. اين امر موجب پاسخگويي رشته‌هاي خاص عصب حلزوني در برابر فركانسهاي خاص مي‌گردد. اين سازوكار اصل مكان ناميده مي‌شود و در سراسر مسير به سمت مغز حفظ مي‌شود.

طرح كدگذاري اطلاعات ديگري نيز در شنوايي انسان به كار مي‌رود كه اصل رگبار ناميده مي‌شود. سلولهاي عصبي اطلاعات را با توليد پالسهاي الكتريكي كوچكي كه پتانسيل كنش ناميده مي‌شوند انتقال مي‌دهد. يك سلول عصبي واقع بر پردة پاييني مي‌تواند اطلاعات صوتي را با توليد يك پتانسيل كنش در پاسخ هر سيكل لرزش كدگذاري كند. براي نمونه يك موج صداي 200 هرتزي مي‌تواند توسط يك نورون ايجاد كنندة 200 پتانسيل كنش در ثانيه نشان داده شود. در هر صورت اين روش تنها در فركانسهاي زير حدوداً 500 هرتز – بالاترين سرعت ممكن توليد پتانسيل كنش در نورونها – به كار مي‌آيد. گوش انسان براي غلبه بر اين مشكل به نورونها اجازه مي‌دهد كه براي انجام اين كار دسته‌جمعي عمل كنند. براي نمونه يك صداي 3000 هرتزي مي‌تواند توسط ده سلول عصبي كه هر كدام 300 ضربه در ثانيه علامت مي‌دهند نشان داده شود. اين پديده بازة كارايي اصل رگبار را تا 4 كيلوهرتز گسترش مي‌دهد كه بالاتر از بازة عملياتي اصل مكان مي‌باشد.

1

شكل شمارة 1- توضيحات مربوط به شكل: نمودار كاركردي گوش انسان. گوش خارجي امواج صوتي را از محيط مي‌گيرد و آنها را به سوي پردة صماخ (طبل گوش) كه ورقة نازكي از بافت است و هماهنگ با شكل موج هوا مي‌لرزد راهبري مي‌كند. استخوانهاي گوش مياني (استخوانهاي چكشي، سنداني و ركابي) اين لرزشها را به دريچة بيضوي كه پرده‌اي منعطف واقع در حلزون گوش پر از مايع است انتقال مي‌دهند. در داخل حلزون گوش پردة اصلي قرار دارد كه ايجاد كنندة ساختاري براي 12000 سلول عصبي شكل‌دهندة عصب حلزون گوش است. بسته به سفتي متغير پردة پاييني، هر سلول فقط به بازة كوچكي از فركانسهاي صدا پاسخ مي‌دهد كه اين پديده گوش را تبديل به يك تحليلگر طيف فركانسي مي‌نمايد.

شكل شمارة 2 رابطة بين شدت صدا و بلندي مشاهده شده را نشان مي‌دهد. غالباً شدت صدا را با يك اندازة لگاريتمي كه دسي‌بل اس.پي.ال. (سطح توان صدا) ناميده مي‌شود نشان مي‌دهند. در اين معيار 0 دسي‌بل اس.پي.ال موج صدايي با قدرت ده به توان منفي شانزده وات بر سانتيمتر مربع است كه حدوداً ضعيف‌ترين صداي قابل تشخيص توسط گوش انسان است. صحبت معمولي حدوداً 60 دسي‌بل اس.پي.ال است و صدايي با شدت 140 دسي‌بل اس.پي.اي براي گوش دردناك و زيان‌آور است.

2

شكل شمارة 2 – واحدهاي شدت صدا. شدت صدا به صورت توان بر واحد مساحت تعريف مي‌شود (مثلاُ وات بر سانتيمتر مربع) يا به صورت معمول‌تر با استفاده از يك اندازة لگاريتمي كه دسي‌بل اس.پي.ال خوانده مي‌شود. همچنان كه اين جدول نشان مي‌دهد قوة شنوايي انسان بيشتر به صداهاي بين 1كيلوهرتز تا 4 كيلوهرتز حساس است.

اختلاف بلندترين و ضعيف‌ترين صداهايي كه انسان مي‌تواند بشنود 120 دسي‌بل است كه از لحاظ دامنه معادل بازه‌اي حدود يك ميليون است. شنونده تغيير بلندي صدا را وقتي صدا حدود 1 دسي‌بل (12% در دامنه) تغيير كند تشخيص مي‌دهد به عبارت ديگر تنها 120 سطح بلندي صدا از ملايم‌ترين نجوا تا بلندترين تندر قابل تشخيص است. حساسيت گوش آنقدر جالب توجه است كه هنگام شنيدن به ضعيف‌ترين صداها پردة صماخ به اندازه‌اي كمتر از قطر يك ملكول به لرزش در‌مي‌آيد!

احساس بلندي صدا با توان صدا رابطة تواني با نماي 1/3 دارد. به عنوان نمونه اگر شما توان صدا را ده برابر كنيد شنوندگان آن صدا دو برابر شدن بلندي صدا را احساس و گزارش مي‌كنند.

اين مسأله يك مشكل بزرگ براي حذف صداهاي محيطي ناخواسته به وجود مي‌آورد. براي نمونه فرض كنيد كه شما 99% ديوار را با عايق صوتي پوشانده‌ايد و تنها 1% كه مربوط به درها، گوشه‌ها، منافذ و… هستند باقي مانده‌اند. با وجود آن كه توان صدا تا اندازة 1% مقدار اولية آن كاسته شده بلندي صدا تنها به اندازة 20% كاهش پيدا كرده‌است. آهنگسازي و تنظيم

بازة شنيداري انسان بين 20 هرتز تا 20 كيلوهرتز در نظر گرفته مي‌شود، حال آن كه بيشتر صداهاي قابل حس در بازة 1 كيلوهرتز تا 4 كيلوهرتز قرار دارند. براي نمونه شنوندگان مي‌توانند صدايي به ميزان صفر دسي‌بل را در فركانس 3 كيلوهرتز بشنوند حال آن كه براي شنيدن يك صداي 100 هرتزي حداقل مقدار آن بايد 40 دسي‌بل باشد. شنوندگان مي‌توانند بگويند كه دو صدا متفاوتند اگر فركانس آنها بيش از حدود 0.3% در 3 كيلوهرتز متفاوت باشد. به عنوان نمونه كليدهاي كنار هم در پيانو به اندازة حدود 6% تفاوت فركانس دارند.

مهم‌ترين مزيت داشتن دو گوش تشخيص جهت صداست. شنوندگان انساني مي‌توانند تفاوت بين دو منبع صدا را كه فاصله‌اي به كمي 3 درجه دارند (حدوداً برابر با عرض يك انسان در فاصلة ده متري) تشخيص دهند. اين اطلاعات جهتي به دو روش جداگانه به دست مي‌آيند. اولاً فركانسهاي حدوداً بالاي 1 كيلوهرتز به شدت زير ساية سر قرار مي‌گيرند. به بيان ديگر گوشي كه به منبع نزديك‌تر است سيگنال قوي تري را به نسبت گوشي كه در جهت مخالف دارد دريافت مي‌كند. روش ديگر تشخيص جهت آن است كه گوش دورتر به خاطر فاصلة بيشترش از منبع صدا را كمي ديرتر از گوش نزديك‌تر دريافت مي‌كند. به واسطة اندازة معمول سر (حدوداً 22 سانتيمتر) و سرعت صوت (حدود 340 متر در ثانيه) تفاوت‌گذاري زاويه‌اي سه درجه دقت زماني حدود 30 ميكروثانيه نياز دارد. چون اين فاصلة زماني نيازمند اصل رگبار است اين روش جهت‌يابي براي صداهاي داراي فركانس كم‌تر از حدود 1 كيلوهرتز به كار مي‌رود.

در حالي كه قوة شنوايي انسان مي‌تواند جهت صدا را تشخيص دهد در نشخيص فاصلة منبع صدا مشكل دارد. اين امر بدان علت است كه چيزهاي كمي در موج صدا وجود دارد كه اطلاعات اين گونه را در اختيار بگذارد. شنوايي انسان به صورت ضعيفي در مي‌يابد كه منابع صداهاي با فركانس بالا نزديكند و صداهاي با فركانس پايين از فاصلة دورتري پخش مي‌شوند. اين به آن دليل است كه صداها در فاصله‌هاي دور از ميزان فركانسشان كاسته مي‌شود. پژواك روش ضعيف ديگري براي تشخيص فاصله است و با استفاده از آن مثلاً مي‌توان ابعاد يك اتاق را حدس زد. براي نمونه صداهاي موجود در يك تالار بزرگ پژواكهايي با وقفة 100 ميلي ثانيه دارند، حال آن كه براي يك دفتر كار كوچك اين مقدار 10 ميلي ثانيه است. بعضي از موجودات با استفاده از دستگاه طبيعي تشخيص فاصلة صوتي مسألة فاصله‌يابي را حل كرده‌اند. مثلاً خفاشها و دلفينها صداهايي مثل تيك و جيغ توليد مي‌كنند كه از سوي اشياء نزديك بازتابيده مي‌شوند. با اندازه‌گيري ميزان وقفة بازتاب اين صدا‌ها اين جانوران مي‌توانند با دقت 1سانتيمتر اشياء را مكانيابي كنند. تجربيات نشان داده‌اند كه بعضي انسانها به خصوص نابينايان تا حد كمي از روش مكانيابي با استفاده از پژواك استفاده مي‌كنند. 

نگاره