كامپيوترها حرف ما را خواهند فهميد

 اگر كامپيوترها قادر به تشخيص زبان گفتاري انسان باشند، شايد روزي بتوانيم براي وارد كردن دستورات و فرمان‌ها از صدا و دستورات گفتاري به جاي صفحه كليد استفاده كنيم. اما اين‌كه كامپيوتر بتواند گفتار انسان را بخوبي تشخيص دهد، امري بسيار سخت به نظر مي‌رسد، چراكه زبان محاوره‌اي تفاوت بسيار زيادي با زبان نوشتاري داشته و تنوع زبان گفتاري و اين‌كه هر زباني هم داراي لهجه‌هاي متفاوتي است، خود معضل ديگري است.هم‌اكنون با سرمايه‌گذاري موسسه VERDIKT تحت نظارت شوراي تحقيقاتي نروژ، پروفسور اسوندسن از دانشگاه NTNU نروژ و همكارانش در حال تست رويكرد ابداعي ـ ابتكاري براي خلق نسل بعدي تكنولوژي تشخيص گفتار هستند. محققان نروژي نشان داده‌اند كه اساس توليد گفتار در همه زبان‌ها يكسان است. به اين ترتيب اين تكنولوژي بدون اتكا به داده‌هاي گفتاري هر زبان قابل توسعه و به كار بردن براي تمرين ماشين‌هاست. محققان تحقيقاتشان را براساس مطالعه فونتيك يا مطالعه اصوات گفتار انسان انجام مي‌دهند. همچنين اطلاعات اضافي ديگري همچون دانش زبان و گويش‌هاي مختلفي را در بانك اطلاعاتي سيستم گنجاندند.تاكنون به‌ منظور تشخيص گفتار دو رويكرد متفاوت شايع‌تر از بقيه بوده است؛ هر دو براساس استفاده از داده‌هاي گفتاري و متون منبع، جهت آموزش به كامپيوتر براي تشخيص زبان‌هاي مختلف بنا شده است. يك رويكرد انتقال قوانين استنتاجي در مورد كلمات و صداها به كامپيوتر است. محققان معتقدند كه با آناليز بخش كوچكي از يك سخنراني مي‌توان تعيين كرد، صداي خاصي كه با تشديد بين 750 تا 1200 هرتز تلفظ شده مربوط به حرف A است و اگر ميزان تشديد بين 350 تا 800 مگاهرتز باشد اين صدا مربوط به حرف U است. رويكرد دوم اين است كه آموزش به ماشين را فراموش كرده و با خوراندن نمونه‌هاي مختلف آوايي و گفتاري بتوان از طريق مقايسه و نمونه‌برداري كامپيوتر را قادر به تشخيص گفتار كرد. در ابتدا ماشين تمام پيشامدهاي صوتي محتمل را دريافت مي‌كند، در اين ميان احتمال تفسير رخدادهايي با فركانس بالاتر توسط ماشين و تفسير آن به صوت نمونه بيشتر است.گروه تحقيقاتي رويكردي را انتخاب كرد كه بين اين دو رويكرد سنتي قرار مي‌گيرد، آنها اطمينان زيادي به رويكرد آماري دارند، از طرفي نياز به توجه به الگوهاي قابل پيش‌بيني در گفتار در دنياي واقعي نيز وجود دارد. در سيستم جديد شاهد تركيبي از يادگيري داده‌محور و رويكرد مبتني بر قواعد هستيم. الگوهاي گفتار با توجه به فيزيولوژي، گويش، فرهنگ و سلامت افراد متفاوت بوده و همه اينها بر اصوات و توليد جملات تاثير مي‌گذارد. براي اين‌كه يك ماشين چگونگي درك اين گفتار را بياموزد بايد قادر به تشخيص شايع‌ترين تغييرات و اختلافات بين گفتار و زبان باشد.






تاريخ : دو شنبه 15 آبان 1391برچسب:, | | نویسنده : مقدم |