16.06.2022

Группа компаний ЦРТ победила в международном конкурсе GRAM VAANI ASR Challenge 2022, который был посвящен распознаванию спонтанной речи в телефонном канале на языке хинди. Теперь распознавание речи от группы ЦРТ доступно на 14 языках мира: русском, английском, казахском, испанском, арабском, немецком, французском, турецком, бенгальском, филиппинском, фарси, урду, португальском, хинди. Об этом рассказал CEO группы компаний ЦРТ в рамках Петербургского международного экономического форума.

Дмитрий Дырмовский, генеральный директор группы компаний ЦРТ: "Участие в международном конкурсе по распознаванию речи на языке хинди — топовый уровень для российских разработчиков — язык экзотичный, сложный, не привычный, а среди конкурентов — в том числе команды, для которых этот язык родной. Именно поэтому победа во всех треках этого конкурса была особо значимой для нас — она демонстрирует не просто распознавание еще одного языка, а филигранные возможности российских разработчиков в области распознавания речи. Качество распознавания речи и многообразие языков и диалектов укрепляют позиции ЦРТ в области речевых технологий, позволяет переводить сервисы из разряда инновационных в повседневные. Технологические достижения уже отражаются на всем продуктовом портфеле группы ЦРТ — мы переносим лучший мировой опыт для наших клиентов и партнеров. Продолжая технологическое развитие и удовлетворяя запросы в том числе зарубежных клиентов, мы прорабатываем распознавание речи еще на пяти языках".

В конкурсе GRAM VAANI ASR Challenge было заявлено три трека, R&D-команда группы ЦРТ (Speech Technology Center, STC) заняла первые места в каждом из них:


Полная версия лидерборда — на сайте конкурса.

WER — "пословная" ошибка распознавания, CER— "посимвольная" ошибка распознавания (чем меньше, тем лучше). Для хинди обе эти метрики крайне важны, так как язык является символьным, текст на нём для русскоязычных пользователей выглядит специфично: नादयाऔररामकीबिल्ली. Записи для конкурса были собраны с помощью платформы Mobile Vaani, работающей с пользователями со всей Индии, и включают региональные и диалектные вариации хинди.

В конкурсе участвовали ведущие мировые и индийские исследовательские команды, в том числе — cовместная команда Индийского института наук и американского некоммерческого научно-исследовательского института (бывший Stanford Research Institute), команда исследовательского института Samsung R&D в Индии, Индийский центр разработки перспективных вычислительных технологий, команда Делфтского технического университета (Нидерланды), а также крупные индийские R&D-компании.

Победы в глобальных конкурсах укрепляют технологический стек группы ЦРТ, позволяют совершенствовать речевую аналитику — автоматизировать работу контактных центров: распознавать спонтанную речь, делать выводы об удовлетворенности клиента и качестве диалога, — существенно оптимизировать работу современных контакт-центров ретейла, e-commerce, телеком, а также создавать диалоговых ассистентов — интеллектуальных текстовых и голосовых роботов для крупного бизнеса и государственного сектора, с которыми легко и приятно взаимодействовать.

Ценность широкого спектра возможностей распознавания речи ЦРТ в том, что это позволяет создавать сложные enterprise-решения: к примеру, среди проектов ЦРТ — билингвальные виртуальные ассистенты, которые могут общаться с клиентами сразу на нескольких языках, оптимизируя обслуживание в дистанционных каналах, а возможность дополнения диалоговых ассистентов речевой аналитикой и биометрией от одного вендора делает процесс реализации проектов быстрее и удобнее.

Речевые технологии группы ЦРТ используют 27 из крупнейших 50 банков и топ-5 телеком-компаний России. За последние три года с применением технологий ЦРТ реализовано более 280 проектов по цифровизации государственных и муниципальных учреждений в 85 субъектах страны. Разработки компании востребованы в регионах APAC, MENA, Латинской Америке. К примеру, в активе ЦРТ — решение на основе речевых технологий и голосовой биометрии, которое используется в ОАЭ, Саудовской Аравии, Катаре, Омане, Иордании, Ливане, Египте, Мексике, Эквадоре, Вьетнаме, Индии и еще 70 странах мира.

Группа компаний ЦРТ — глобальный разработчик продуктов и решений на основе разговорного искусственного интеллекта, машинного обучения и компьютерного зрения c 30-летним опытом. Технологический эксперт в области речевых технологий, лицевой и голосовой биометрии. Группа ЦРТ фокусируется на создании AI-решений для сегментов B2B и B2G: реализовано более 5 тыс. AI-проектов по всему миру, в том числе — национального масштаба — в Мексике, Эквадоре, Ближнем Востоке. В России решения ЦРТ работают в крупнейших банках, телеком-компаниях, ТЭК, госсекторе, применяют для реализации концепции Safe&Smart City. Технологии выявления подделок голоса и распознавания речи от группы ЦРТ занимают лидирующие позиции в мировых рейтингах NIST, ASVspoof Challenge, CHiME Challenge.