درس:پردازش گفتار دیجیتال/فصل اول/مقدمه

از ویکی جامع پردیس دانشگاهی دانشگاه قم
پرش به: ناوبری، جستجو
جزوه درس پردازش گفتار دیجیتال
Digital Speech Processing.jpg
پردازش گفتار دیجیتال
عنوان درس پردازش گفتار دیجیتال
رشته دانشگاهی مهندسی کامپیوتر، مهندسی فناوری اطلاعات
نویسنده دکتر روح الله دیانت
سرفصل های درس مقدمه، سیگنال و سیستم، صدا
مقطع تحصیلی کارشناسی ارشد
درس پردازش گفتار دیجیتال

مقدمه

تعريف: به يک تابع رياضي اصطلاحا سيگنال گفته مي شود. سيگنال ها در بحث ما معمولا تابعي از زمان ، مکان يا فرکانس مي باشند. همچنين سيگنال مي تواند يک بعدي، دوبعدي، سه بعدي و... باشد. مثال ‏0 1- الف) ولتاژ يک سيم را مي توان به صورت يک سيگنال زماني يک بعدي نشان داد. ب) صوت (صدا) مثالي ديگر از يک سيستم زماني يک بعدي مي تواند باشد. ج) تصوير يک سيگنال يک سيگنال مکاني دوبعدي است. چون هر نقطه از تصوير داراي يک طول و عرض مي باشد. يعني يک تصوير را مي توان به صورت f(x,y) نشان داد. د) ويدئو در واقع مجموعه اي از تصاوير مي باشد. ويدئو يک سيگنال سه بعدي است که دو بعد آن را مکان (مختصات نقطه) تشکيل مي دهد و بعد سوم آن زمان مي باشد. يعني يک ويدئو را مي توان به صورت f(x,y,t) نشان داد (شکل ‏2 1). از يک جنبه مهم ديگر مي توان سيگنال ها را به سه دسته پيوسته ، گسسته و رقمي تقسيم کرد. پيش از توضيح اين سه خاطرنشان مي کنيم که هر سيگنال مانند يک تابع رياضي داراي دامنه و برد مي تواند باشد. سيگنال پيوسته: سيگنالي است که هم از جهت دامنه و هم برد پيوسته باشد. ولتاژ يک سيم يا سيگنال صدا نمونه هايي از سيگنال هاي گسسته مي باشند. سيگنال گسسته: سيگنالي است که از جهت دامنه گسسته باشد اما داراي برد پيوسته باشد. مثال ‏0 2- اگر ولتاژ يک سيم را در زمان هاي مختلف مثلا 1، 2، 3 .. ثانيه ثبت کنيم (يا به اصطلاح دقيق تر نمونه برداري کنيم) اين مقادير ولتاژي، يک سيگنال گسسته را تشکيل مي دهند. مثال ‏0 3- با نمونه برداري از يک تصوير پيوسته که يک سيگنال پيوسته مي باشد آن را به گسسته تبديل مي کنند. نحوه نمونه برداري به اين شکل است که تصوير را به نقاط کوچکي که اصطلاحا پيکسل خوانده مي شوند تقسيم کرده و مقدار شدت نور آن نقطه را به دست آورند. علت انجام اين نمونه برداري و رسيدن به سيگنال گسسته اين است که براي کامپيوتر ذخيره سازي بي نهايت مقدار امکان پذير نيست. در نتيجه اگر بخواهيم اگر بخواهيم يک سيگنال پيوسته را تحليل کنيم ابتدا بايد آن را به گسسته تبديل کنيم. سيگنال رقمي: سيگنالي است که هم از جهت دامنه و هم از نظر برد گسسته باشد. توضيح علت تعريف و استفاده از سيگنال رقمي: مشکل ديگري که در خصوص تحليل سيگنال ها با کامپيوتر پيش مي آيد اين است که ظرفيت ذخيره سازي کامپيوتر محدود مي باشد. در نتيجه با محدوده برد پيوسته دچار مشکل خواهد شد. مثال ‏2 4 اين مسئله را واضح تر مي کند. مثال ‏0 4- فرض کنيد يک سيگنال يک بعدي پيوسته داشته باشيم و مي خواهيم به کمک کامپيوتر روي آن تحليلي انجام دهيم. به علت عدم امکان ذخيره سازي بي نهايت مقدار، آن را به سيگنالي گسسته با مقادير زير تبديل کرديم. X=[0 1 5 5.5 9 -1 11 5 3 ] فرض کنيد کامپيوتري داريم که قادر است تنها براي هر عدد سه بيت اختصاص دهد. با داشتن سه بيت واضحا مي توان 8 مقدار را نشان داد. با توجه به اينکه در x هم 8 علامت داريم. در اينجا ذخيره سازي مقادير x در کامپيوتر به ترتيب زير انجام مي گيرد. -1: 000 0: 001 1:010 3:011 5:100 5.5: 101 9:110 11:111 اکنون فرض کنيد x ما به صورت زير باشد. X=[0 1 5 5.5 9 -1 11 5 3 0 11.1] در اينجا x داراي 9 علامت است که با توجه به اينکه کامپيوتر تنها مي تواند 8 علامت را نشان دهد ذخيره سازي x امکان پذير نيست. براي اينکه اين ذخيره سازي ممکن باشد بايد تعداد علامت هاي x را به 8 عدد کاهش داد. يک راه اين است که 11.1 را به نزديک ترين عدد يعني 11 تبديل کنيم که به اين ترتيب باز 8 علامت خواهيم داشت. راه ديگر که کلي تر است اين است که ابتدا تفاضل مقدار بيشينه و کمينه داده را بر تعداد علائم قابل نمايش توسط کامپيوتر محاسبه کنيم. (11.1+1)/8=1.5125 سپس به ترتيب زير عمل کنيم.


با توجه روابط بالا هر يک از مقادير x به صورت زير در کامپيوتر قرار مي گيرد. -1: 000 0: 000 1:001 3:010 5:011 5.5: 100 9:110 11:111 روش فوق يکي از روش‏هايي است که به آنها رقمي‏کردن گفته مي‏شود. اين روش را اصطلاحا رقمي‏کردن يکنواخت ناميده‏اند؛ از آن رو که بازه‏ها در اين روش يکسان هستند. در مقابل، روش‏هاي رقمي‏کردن غيريکنواخت وجود دارند که در آنها طول بازه‏ها يکسان نيست؛ بلکه به صورتي انتخاب مي‏شود که نتايج بهتري داشته باشيم. به طور خلاصه: • عدم امکان ذخيره سازي بي نهايت مقدار منجر به نمونه برداري، گسستگي دامنه و در نتيجه تبديل سيگنال پيوسته به گسسته شد. • محدود بودن ظرفيت ذخيره سازي کامپيوتر منجر به گسستگي در حوزه برد و در نتيجه تبديل سيگنال گسسته به رقمي شد. • براي تبديل سيگنال پيوسته به گسسته از روش نمونه برداري و براي تبديل گسسته به رقمي از روش هاي رقمي کردن استفاده مي شود. • يک داده موجود ابتدا معمولا به صورت پيوسته است و براي آنکه براي کامپيوتر قابل فهم باشد بايد به سيگنال رقمي تبديل شود. در نتيجه اين تبديل مقداري از اطلاعات سيگنال ممکن است از بين برود.