فارس‌دات بزرگ میکروفونی

یکی از مهم‌ترین ابزارها برای طراحی و ساخت سیستم‌های هوشمند شناسایی گفتار، تهیۀ حجم وسیعی از دادگان گفتاری برای آموزش مدل‌های آکوستیکی صداها و آواهای تشکیل‌دهندۀ یک زبان است. برای تعلیم مناسب صداها و آواهای تشکیل‌دهندۀ یک زبان، تعداد بسیاری زیادی نمونه از این آواها که توسط گویندگان مختلف ادا شده است، بایستی ضبط و پالایش شود.

دادگان فارس‌دات گفتاری بزرگ میکروفونی (L-FarsDat)، مجموعه‌ای گفتاری و نوشتاری از متون رسمی (روزنامه) است که توسط گویندگان فارسی‌زبان بیان شده است. دادگان گفتاری در سطح کلمه و جمله تقطیع و برچسب‌دهی شده‌اند. تهیۀ این دادگان تأثیر به‌سزایی در تحقیقات وسیع و گسترده در زمینۀ بازشناسی گفتار پیوستۀ فارسی با دایرۀ لغات بزرگ (LVCSR) در دانشگاه‌های تراز اوّل و مراکز تحقیقاتی کشور داشته است. این دادگان، به­عنوان دادگان استاندارد گفتاری زبان فارسی برای سیستم‌های LVCSR در داخل و خارج کشور شناخته شده و برای آموزش سیستم‌های تبدیل گفتار به متن استفاده می‌شود. اهمّیت طراحی و ساخت این دادگان در زبان فارسی، همانند اهمّیت دادگان WSJ در زبان انگلیسی است. در زبان فارسی، دادگانی با تنوّع، وسعت و کیفیت برچسب‌زنیِ دادگان فارس‌دات بزرگ میکروفونی وجود ندارد. البتّه این مهم با تلاش و کوشش مجموعه‌ای از محققان دانشگاه‌های برتر کشور میسّر شده است.

دادگان فارس‌دات دارای ويژگی­ها و قابلیت‌های زیر است:

  • ضبط دادة صوتی بیش از 73 ساعت با تنوع گویندگان (100 گوینده زن و مرد)
  • انتخاب متون متنوع فارسی از روزنامه‌های فارسی
  • مجموعة واژگان محتوی حدوداً 26 هزار کلمه
  • برچسب‌گذاری گویندگان برحسب جنسیت، سن، میزان تحصیلات و گویش
  • ضبط صدا از هر گوینده با کیفیت صوتی مناسب  در محیط کاری آرام (Office) بوسیله میکروفون رومیزی (unidirectional desktop microphone) 
  • برچسب‌گذاری دستی متون در سطح ابتدا و انتهای کلمه و جمله
  • حاوی فایل دنبالة کلمات گفته‌شده فارسی با قالب .doc  (به‌صورت متن فارسی)
  • برچسب‌گذاری واجی (Phonemic) کلمات برحسب تعداد 29 واج فارسی
  • برچسب‌گذاری اصوات غیر زبانی (non-linguistic)
  • ضبط جملات با نرخ نمونه‌برداری 22050 Hz و فرمت نمونه‌برداری PCM 16 بیتی
  • اولین دادگان بزرگ میکروفونی برچسب‌دار در سطح کلمه برای بازشناسی گفتار پیوستۀ فارسی در کشور
  • استفاده در طراحی و ساخت سیستم‌های هوشمند تشخیص گفتار (تبدیل گفتار به متن فارسی) و تعیین و تأیید هویت گوینده
  • استفاده برای کاربردهای پژوهشی و دانشگاهی در تمامی مراکز و دانشگاه‌های فعّال در زمینۀ پردازش گفتار
  • قابل استفاده در دانشکده‌های فنّی- مهندسی و نیز دانشکده‌های زبان‌شناسی به­عنوان دادگان استاندارد
  • استفاده‌شده در مجموعة دادگان تعلیم نرم‌افزارهای فارسی تبدیل گفتار به متن (نرم‌افزار شنوا و نرم‌افزار نویسا)