توسعه هوش مصنوعی در آیگپ/ بروزرسانی سرویسهای کاربردی TTS و ASR
در راستای توسعه هوش مصنوعی در آیگپ، سرویسهای TTS (تکنولوژی تبدیل متن به گفتار) و ASR(تکنولوژی تبدیل صوت به متن) با تغییرات چشمگیری، بروزرسانی شد.
به گزارش روابط عمومی آیگپ، پیامرسان آیگپ در مسیر توسعه و همگام سازی با نمونه های موفق کاربردی و پرطرفدار مشابه در دنیا، پس از برداشتن اولین گام در مسیر هوشمند شدن که همراه با ارائه سومین نسل از این پیامرسان اتفاق افتاد، سرویسهای کاربردی و پرطرفدار TTS و ASR را بروزرسانی کرد.
در این بروزرسانی، اتفاقات متفاوتی رخ داده که آیگپ را متمایز از سایر پیامرسانها در مسیر هوشمند شدن قرار داده است.
سرویس TTS (تکنولوژی تبدیل متن به گفتار)
سرویس TTS (تکنولوژی تبدیل متن به گفتار) در نسخه بروزرسانی شده با قابلیتهای پایه زیر ارائه شده است:
• قابلیت خوانش متون فارسی
• قابلیت اعرابگذاری خودکار متون
• امکان تغییر سرعت گوینده
• قابلیت خوانش اعداد
• امکان سفارشیسازی لحن گوینده
• امکان ایجاد محیط گرم و تعاملی با استفاده از چیت چت
• توانایی سفارشی سازی صدای گوینده خاص
• گوینده پایه خانم و آقا
• قابلیت افزایش و کاهش استاتیک کلمات خاص در دیکشنری
بروزرسانیهای انجام شده در سرویس TTS در حوزههای مختلفی انجام شده که در ادامه به آنها می پردازیم:
• تصحیح اشتباهات پرتکرار در خوانش
در این بروز رسانی، مدل جدیدی پیادهسازی شده است که به صورت اخصاصی تعداد زیادی از اشتباهات و تلفظهای غلط را شناسایی کرده و در لغتنامه موتور تصحیح میکند.
• سانسور محتوای نامناسب
در بروز رسانی جدید، سرویس، پیامی که حاوی کلمات نامناسب باشد را خوانش کرده و با صدای "بوق" از روی کلمه نامناسب عبور خواهد کرد.
• خوانش ایموجی
در نسخه جدید، ایموجیهای پرتکرار شناسایی شده و با اسم متناظرشان خوانده میشوند.
• موارد نگارشی
در این بروز رسانی، سرویس در برخورد با علائم نگارشی، رفتاری صحیح از خود نشان خواهد داد. برای مثال در صورت برخورد با ویرگول مکث کرده و یا با پایان یک پاراگراف و شروع پاراگراف بعدی، به اندازه لازم مکث خواهد داشت.
سرویس ASR (تکنولوژی تبدیل صوت به متن)
سرویس ASR (تکنولوژی تبدیل صوت به متن) در نسخه بروزرسانی شده با قابلیتهای پایه زیر ارائه شده است:
• تبدیل گفتار فارسی به متن با دقت و سرعت بالا
• قابلیت تبدیل گفتار محاورهای و رسمی به متن
• امکان تشخیص گویندگان متفاوت در یک فایل صوتی
• تشخیص لهجههای مختلف زبان فارسی
• قابلیت تبدیل گفتار به متن برای زبانهای دیگر
• مقاوم در برابر نویز
بروزرسانیهای انجام شده در سرویس ASR در حوزههای مختلفی انجام شده که در ادامه به آنها می پردازیم:
• دقت:
این بروز رسانی، به صورت اختصاصی با تمرکز بر روی پیام رسانها و کاربرهایی که میخواهند از پیام رسان استفاده کنند، پیادهسازی شده است. این تمرکز، باعث افزایش دقت سرویس در حوزههای زبان محاورهای، تشخیص نویز، مکث و سکوت، بهبود ویسهای ضبط شده با میکروفونهای ضعیف و تسلط بر دایره جملات استفاده شده در ارتباط کاربران با یکدیگر شده است.
• حجم مدل:
در بروز رسانی جدید، با فشردهسازیهای انجام شده و کمتر شدن حجم سرویس، افزایش قابل توجهی را بر روی سرعت سرویس شاهد هستیم.
علاقهمندان میتوانند برای استفاده از امکانات و قابلیتهای هوش مصنوعی در آیگپ و همچنین سایر خدمات این پیامرسان، نسبت به نصب آیگپ اقدام کنند.