КБГУ запустил уникальный проект по сохранению языков
В Кабардино-Балкарском государственном университете им. Х.М. Бербекова стартовал масштабный проект, который призван сохранить и интегрировать в цифровую эпоху кабардинский и балкарский языки. В основе инициативы — использование современных технологий искусственного интеллекта для создания больших языковых моделей.
Конечная цель проекта — создание большой языковой модели, которая сможет генерировать тексты и вести диалог на кабардинском и балкарском языках.
О подробностях разработки рассказала проректор по научно-исследовательской работе КБГУ Светлана Хаширова на совещании с руководителями ключевых подразделений вуза.
«Мир стоит на пороге повсеместного внедрения ИИ, — подчеркнула Светлана Юрьевна. — Буквально через 3–5 лет искусственный интеллект достигнет принципиально нового уровня развития, и наша задача — научить его работать с кабардинским и балкарским языками. Основная проблема заключается в недостаточном объёме качественных данных для обучения нейросетей. Если не решить эту задачу сейчас, наши языки рискуют оказаться на периферии глобальной цифровой системы, что создает угрозу для их дальнейшего существования».
По поручению ректора КБГУ Юрия Альтудова запущены два специальных внутренних гранта — для кафедры кабардино-черкесского языка и литературы и для кафедры карачаево-балкарской филологии. Финансирование уже выделено из собственных средств университета, что позволяет начать работу без промедлений.
К проекту привлечены студенты социально-гуманитарного института, которые станут помогать в сборе и обработке языкового материала.
«Главная задача на первом этапе — создание обширной и разнообразной базы данных, — пояснил Мусадин Карданов, заведующий кафедрой кабардино-черкесского языка и литературы. — Необходимо собрать не однотипные тексты, а максимально полный спектр языка: художественную литературу, газеты, фольклор, разговорную речь».
«Наше ключевое преимущество — в научном подходе, — подчеркнул заведующий кафедрой карачаево-балкарской филологии Мусса Кетенчиев. — В отличие от стихийно собранных данных, мы, филологи, способны создать сбалансированный и репрезентативный корпус текстов. Мы обеспечим не только объем, но и качество, лингвистическое разнообразие — то, что позволит обучить по-настоящему грамотный и культурно чувствительный искусственный интеллект».
Все собранные данные — тысячи аудиофайлов и текстовых фрагментов — направят в специальные системы для обучения ИИ. Для выполнения этих задач университет планирует приобрести высокопроизводительный сервер, который станет одним из мощнейших вычислительных центров на Северном Кавказе.
Проект носит междисциплинарный характер. К работе филологов подключатся специалисты Института электроники, робототехники и искусственного интеллекта под руководством Замира Шомахова и Цифровой кафедры КБГУ во главе с Альбертом Шапсиговым. Именно они будут курировать техническую сторону: обучение ИИ, тестирование и доработку моделей.