В эпоху стремительного развития технологий ISSAI при Назарбаев Университете продолжает искать пути эффективного взаимодействия человека и компьютера на казахском языке. Очередным прорывом в этом направлении стал первый цифровой прототип человека – помощница по имени Umay (Ұмай), которую недавно с гордостью презентовала команда ISSAI.
Umay представляет собой виртуального помощника, владеющего государственным языком, созданного в цифровой форме в виде реалистичного человеческого аватара женского пола. Ее возможности охватывают широкий спектр областей, включая науку, образование, историю, технологии и медицину.
Имя богини-матери из тюркской мифологии дано аватару символично. Во-первых, это связь с казахской культурой, во-вторых, Ұмай — первый прототип цифрового человека, по задумке команды станет прородительницей будущих цифровых помощников.
«Нашей главной целью было показать передовые возможности казахстанской интеллектуальной силы, а именно небольшой команды ISSAI, и заявить: «Мы можем делать это в Казахстане». UMAY использует ряд ключевых технологий, разработанных нашим институтом. К ним относятся преобразование текста в речь, автоматическое распознавание речи, нейронный машинный перевод, быстрое проектирование и фотореалистичный аватар», — отметил директор ISSAI, заведующий кафедрой и профессор в Школе инженерных и цифровых наук Назарбаев Университета Атакан Варол.
По словам доктора Варола, основной технической задачей проекта была системная интеграция, то есть команде нужно было заставить работать множество ИИ-систем одновременно. Так, прототип использует ChatGPT от OpenAI, хотя он известен своей неоптимальной работой на казахском языке. Чтобы преодолеть это ограничение, Umay использует усовершенствованную модель нейронного машинного перевода «Tilmash», которая также разработана в ISSAI Назарбаев Университета. Эта программа помогает переводить запросы пользователей на английский язык и впоследствии преобразует ответы, данные ChatGPT, обратно на казахский язык.
«Наш институт ранее создал систему двустороннего машинного перевода на 4 языка под названием Tilmash. Эта модель, собранная на основе большого объема текстов в разных стилях, может конкурировать с переводчиками Google и Yandex. Модель переводит озвученные на казахском запросы на английский, и затем ответы от ChatGPT переводит с английского на казахский язык», — объясняет один из разработчиков Umay, старший аналитик данных ISSAI Аскат Куздеуов.
Благодаря программному продукту Unreal Engine 5, Umay обеспечивает высококачественную лицевую анимацию в реальном времени. Она объединяет передовые речевые технологии, разработанные в ISSAI, в том числе автоматическое распознавание речи (ASR) и преобразование текста в речь (TTS), для облегчения естественного и свободного общения на казахском языке.
При дальнейшем развитии, Umay может стать дополнением к рабочей силе для повышения эффективности и снижения затрат во многих областях. Для дальнейшей настройки и применения UMAY необходима собственная большая языковая модель, то есть казахский искусственный разум. Обучение большой языковой модели требует огромного хранилища данных и вычислительных ресурсов. Это только начало большого пути, требующего поддержки от государства и общества, отмечают аналитики Назарбаев Университета.
Как работает цифровой помощник можно увидеть на видео.
Институт умных систем и искусственного интеллекта (ISSAI) был основан в сентябре 2019 года, с целью служить движущей силой исследований и инноваций в цифровой сфере Казахстана в области исследований искусственного интеллекта. Институт, расположенный в исследовательском корпусе C4 Назарбаев Университета, проводит междисциплинарные исследования в области машинного интеллекта для решения реальных проблем промышленности и общества. ISSAI стремится развивать национальный потенциал для исследований в области искусственного интеллекта, используя опыт примеров из Азии, Европы и США. ISSAI обеспечивает основу для исследований, инноваций и сотрудничества с национальными и международными партнерами в сфере образования, промышленности и правительства и вносит вклад в цифровую экосистему Казахстана для продвижения целей национального развития.








