فارس دات تلفنی

یکی از مهم‌ترین ابزارها برای طراحی و ساخت سیستم‌های هوشمند شناسایی گفتار، تهیۀ دادگان گفتاری برای آموزش مدل‌های آکوستیکی صداها و آواهای تشکیل‌دهندۀ یک زبان است. برای تعلیم صداها و آواهای تشکیل‌دهندۀ یک زبان، تعداد بسیاری زیادی نمونه از این آواها که توسط گویندگان مختلف ادا شده است، باید توسط انسان و به­صورت دستی و با دقّت میلی‌ثانیه از گفتار آنها استخراج شود.

دادگان فارس‌دات (FarsDat)، مجموعه‌ای از عبارات و جملات است که توسط گویندگان فارسی‌زبان از مناطق مختلف کشور بیان شده است. این دادگان توسط افراد متخصّص در سطح واج (آوا) با دقّت میلی‌ثانیه تقطیع و برچسب‌دهی شده و به­صورت فایل‌های مجزا ذخیره گردیده است. بدون تهیۀ این دادگان، شروع تحقیقات وسیع و گسترده در زمینۀ بازشناسی گفتار پیوستۀ فارسی با دایرۀ لغات بزرگ (LVCSR) در دانشگاه‌های تراز اوّل و مراکز تحقیقاتی کشور میسّر نبوده است. این دادگان، به­عنوان دادگان استاندارد گفتاری زبان فارسی در داخل و خارج کشور شناخته شده و برای آموزش سیستم‌های هوشمند تشخیص گفتار استفاده می‌شود. اهمّیت طراحی و ساخت این دادگان در زبان فارسی، همانند اهمّیت دادگان TIMIT در زبان انگلیسی است. در زبان فارسی، دادگانی با تنوّع، وسعت و کیفیت برچسب‌زنیِ دادگان فارس‌دات وجود ندارد. البتّه این مهم با تلاش و کوشش مجموعه‌ای از محققان دانشگاه‌های برتر کشور میسّر گردیده که اوّلین و مهم‌ترین گام را در شناسایی گفتار پیوسته در زبان فارسی برداشته‌اند.

دادگان فارس‌دات دارای ويژگی­ها و قابلیت‌های زیر است:

  • استخراج پرکاربردترین کلمات زبان فارسی از روزنامه‌ها
  • طراحی 386 جمله با استفاده از 1000 کلمه شامل کلیۀ دنباله‌های دوآوایی در زبان فارسی
  • متوازن بودن 386 جمله مذکور از لحاظ آوایی (Phonetically-Balanced Sentences)
  • انتخاب 304 گوینده بر حسب جنسیت، سن، میزان تحصیلات و لهجه از نقاط مختلف کشور
  • پوشش 10 لهجه رایج فارسی در کشور (تهرانی، ترکی، اصفهانی، جنوبی، شمالی، خراسانی، بلوچی، کردی، لری و یزدی)
  • تولید 20 جمله در 2 جلسه توسط هر گوینده با کیفیت صوتی بسیار بالا در اتاقک آکوستیکی و مخصوص ضبط صدا
  • تقطیع دستی جملات به آواهای تشکیل‌دهندۀ آنها و تهیۀ برچسب‌های واجی و آوایی برای آن
  • ضبط جملات با فرکانس 22050 Hz و با کیفیت بسیار بالا (نسبت سیگنال به نویز 34 دسی‌بل)
  • تهیۀ نرم‌افزار مخصوص استفاده از دادگان فارس‌دات به­منظور استفاده آسان‌تر از آن توسط کاربران
  • استفاده از نشانه‌گذاری بین‌المللی IPA برای برچسب‌زنی آواها و واج‌های زبان فارسی
  • تأیید کیفیت دادگان توسط مؤسسۀ بین‌المللی ELRA
  • برطرف­کردن نقاط ابهام در برچسب‌زنی توسط دستگاه Sona-Graph
  • دارابودن ساختاری شبیه به ساختار دادگان انگلیسی TIMIT (استاندارد ترین و معتبرترین دادگان گفتاری در زبان انگلیسی).
  • دارای مقالۀ مرجع چاپ شده در کنفرانس SST’1994 و قابل ارجاع برای پژوهش­گران
  • اوّلین و تنها دادگان استاندارد برچسب‌دار در سطح آوا برای بازشناسی گفتار پیوستۀ فارسی در کشور

سازگاری برنامه استفاده از فارس‌دات با سیستم عامل Windows

  • استفاده در طراحی و ساخت سیستم‌های هوشمند تشخیص گفتار (تبدیل گفتار به متن فارسی) و تعیین هویت گوینده
  • استفاده برای کاربردهای پژوهشی و دانشگاهی در تمامی مراکز و دانشگاه‌های فعّال در زمینۀ پردازش گفتار
  • استفاده در دانشکده‌های فنّی- مهندسی و نیز دانشکده‌های زبان‌شناسی به­عنوان دادگان استاندارد

رتبۀ سوم تحقیقات کاربردی جشنوارۀ بین­المللی خوارزمی در سال 1374