درس:پردازش گفتار/فصل سوم

از ویکی جامع پردیس دانشگاهی دانشگاه قم
پرش به: ناوبری، جستجو

در ابتدای کتاب گفته شد که در زبان انگلیسی، برای صدا دو واژه sound و audio وجود دارد که اولی شامل هر نوع صدایی می‏شود اما دومی به معنای صداهايی است که برای انسان قابل شنيدن است. Audio نیز به نوبه خود به دو بخش گفتار[۱] و غيرگفتار[۲] تقسيم می شود. گفتار يعنی صداهايی که انسان از مخارج حروف توليد می کند و با آن مفاهيم مورد نظر خود را بيان می کند.

پاره ای از موضوعات اين فصل، در مورد audio به طور کلی است و بعضی نیز، مانند بازشناسی، اختصاص به گفتار دارد. قسمت اول اين بخش اختصاص به بيان پاره ای از مقدمات خواهد داشت؛ بحث هايی در مورد گوش انسان و محدوده فرکانسی قابل درک آن، نمونه برداری از سيگنال صوتی و تبديل صدای پیوسته، آن به سيگنال رقمی خواهيم داشت. سيگنال رقمی را می توان به صورت يک فايل به کامپیوتر داد. از اين رو در مورد فرمت های معروف فايل های صوتی مطالبی بيان خواهد شد. در قسمت دوم در مورد سه پردازش مهم صوت توسط کامپيوتر، يعنی بهسازی، فشرده سازی و بازشناسی صحبت خواهد شد.


بخش های این فصل

پاورقی

  1. Speech
  2. Non-Speech