کاوشگر کلمات (جویا)

يافتن کلمات و واژگان خاص در مکالمات صوتی و گفتاری (Keyword Spotting)، کاربردهای فراوانی داشته و از اهمّيت بسيار بالايی برخوردار است. سامانۀ جويا ابزاری است برای يافتن کلمات مهم و مورد نظرِ کاربر در گفتار محاوره‌ای و واقعی که از آخرين فناوری­های پيشرفته در پردازش گفتار بهره می‌گيرد.

در سامانۀ جويا، کاربر تعدادی از کلمات کليدی بسيار مهم را که Keyword ناميده می‌شود، انتخاب می‌کند. برای آموزش اين کلمات به سامانه، نيازی به اَدا کردن و گفتن آنها و يا جمع‌آوری دادگان آموزشی نيست؛ و تنها لازم است که کاربر، کلمۀ مورد نظر را از يک فرهنگ لغات انتخاب کند و در صورت عدم وجود کلمه در فرهنگ لغت، دنبالۀ اصوات تشکيل‌دهندۀ آن کلمه را در سامانه وارد کند. پس از مشخّص­شدن کلمات کليدی، سامانه در مکالمات محاوره‌ای صوتی جستجو می‌کند و هر جا کلمه مورد نظر را يافت، اعلام می‌کند (Alarm) و محل وقوع زمانی کلمه گفته شده را در فايل صوتی به کاربر گزارش می‌دهد.

نسخۀ فعلی نرم‌افزار جویا (کاوش­گر کلمات) دارای ويژگی­ها و قابلیت‌های زیر است:

  • قابليت اضافه کردن کلمات کليدی جديد به تعداد نامحدود (Unlimited Vocabulary).
  • قابليت اضافه کردن کلمات کليدی جديد از يک فرهنگ لغت (شامل 50.000 کلمۀ پرکاربرد در زبان فارسی).
  • قابليت اضافه کردن کلمات کلیدی که در فرهنگ لغت موجود نيستند (با وارد کردن دنباله آواهای تشکیل‌دهندۀ کلمۀ کلیدی جدید با استفاده از یک صفحه کلید مخصوص).
  • عدم نیاز به دادگان آموزشی برای تعریف کلمات کلیدی و یا بیان این کلمات توسط کاربر
  • قابليت تنظيم ميزان دقّت آشکارسازی (Detection Rate) و خطای False Alarm توسط کاربر
  • قابليت جستجوی همزمان، به دنبال تمامی کلمات کليدی تعريف شده توسط کاربر.پ
  • استفاده از روش­های مقاوم برای مدل­سازی آکوستيکی و کاهش اثر نويز و کانال ارتباطی
  • دارای یک واسط کاربری متن­کاوی (Text Mining) برای جستجو به­صورت متنی در خروجی موتور جستجوی گفتاری
  • ارائۀ يک عدد به کاربر برای نشان­دادن درصد اطمينان (از 0% تا 100%) در آشکارسازی کلمات (Confidence Measure).
  • قابليت استفاده از توان محاسباتی رایانه­های چندپردازنده (Multi-Processor) با استفاده از تکنیک Multi-Threading .
  • اولين محصول عملياتی و کاربردی با سرعت بالا و خطای پايين برای آشکارسازی کلمات در مکالمات تلفنی در کشور.
  • سازگاری با سیستم عامل Windows XP و Windows 7
  •  پردازنده Core i7 و بالاتر
  •  500 مگابايت حافظه RAM به­ازای هر Thread
  • پيدا کردن کلمات کليدی خاص در آرشيوهای صوتی و گفتاری (به­عنوان مثال در سازمان صدا و سيما يا ارگان‌های ديگر).
  • استفاده از جويا به عنوان يک موتور جستجوی گفتاری (Voice Search Engine) برای يافتن کلمات و یا ترکیبی از آنها در فايل‌های صوتی
  • يافتن کلمات بسيار حسّاس در مکالمات صوتی برای کاربردهای امنيتی
  • استفاده از جويا برای ارزيابی نحوۀ تکلّم کلمات خاص و امتيازدهی به افرادی که در بيان کلمات مشکلاتی دارند.