Проект по автоматизированному распознаванию казахской речи запускает Институт умных систем и искусственного интеллекта Назарбаев Университета (ISSAI). С его помощью казахский язык можно будет активно внедрять в глобальное цифровое пространство.
Для реализации проекта ученые собрали самую большую базу голосовых данных на казахском языке — 300 часов записанной речи двух тысяч человек. Применение новой разработки открывает большие возможности — распознавание казахской речи виртуальными помощниками, использование во всевозможных программах и технологии «умного» дома. Кроме того, этот проект даст большой толчок развитию инклюзии в Казахстане. Новая технология может применяться в голосовых и текстовых программах, широко использующихся людьми с особыми потребностями. «Прежде отсутствие достаточно большой базы данных было препятствием для применения казахского языка в цифровом мире, поэтому мы и инициировали этот проект. Сейчас мы готовы поделиться собранной базой данных казахской речи с открытым исходным кодом со всеми исследователями и цифровыми предпринимателями, чтобы максимизировать проекта положительное влияние на экономику и общество страны», – сказал профессор Атакан Варол, директор ISSAI NU. К слову, запуск проекта был приурочен к первой годовщине создания Института умных систем и искусственного интеллекта Назарбаев Университета — 14 сентября ISSAI отметил свой первый день рождения. По ссылке https://issai.nu.edu.kz/kz-speech-corpus/ можно получить доступ к собранной базе данных, а также протестировать технологию распознавания казахской речи.
Источник: Казинформ