Whisper یک ابزار قوی تشخیص گفتار مبتنی بر هوش مصنوعی است که از نظارت ضعیف در مقیاس بزرگ استفاده می کند. این یک مدل همه منظوره است که می تواند تشخیص گفتار چند زبانه، ترجمه گفتار و شناسایی زبان گفتاری را انجام دهد. این مبتنی بر یک مدل دنباله به دنباله است که امکان نمایش مشترک توکن های دنباله و رمزگشایی پیش بینی را فراهم می کند. این مدل پنج مدل در دسترس را با سرعت و دقت متفاوت ارائه می دهد. این منبع باز تحت مجوز MIT است.
- رونویسی صداهای ضبط شده
- ترجمه گفتار در زمان واقعی
- شناسایی زبان گفتاری در داده های صوتی
جزئیات : Whisper
قیمتگذاری :
رایگان
تعداد بازدید : 155
۱۴۰۲-۴-۱۶
برچسب ها :
گفتار به متن
سمعی
آدرس سایت :
Whisper