В рамках стратегического плана по развитию искусственного интеллекта в Казахстане Назарбаев Университет совместно с АО "Национальные информационные технологии" разрабатывают казахскую языковую модель KazLLM, передает inbusiness.kz.
Проект, предполагающий создание модели на базе 100 млрд токенов, должен стать одним из ключевых шагов на пути к усилению научных исследований в области ИИ и повышению цифровой автономии страны.
По словам Гиззата Байтурсынова, председателя комитета искусственного интеллекта и развития инноваций, модель будет интегрирована с различными государственными и коммерческими системами для улучшения обработки и анализа казахского языка. Ожидается, что первая версия KazLLM будет представлена в декабре нынешнего года.
Проект также включает в себя национальный сбор данных через платформу Hugging Face, где уже собрано 30 млрд токенов из открытых источников и 90 терабайт данных из государственных архивов и СМИ. Эти меры направлены на обеспечение высокого качества и представительности будущей модели.
Байтурсынов подчеркнул, что к 2029 году Казахстан планирует довести количество патентов в области ИИ до не менее 20 в год, что станет свидетельством роста внутренних научных и технологических компетенций. Создание KazLLM не только способствует научным исследованиям, но и создает предпосылки для развития местной экосистемы ИИ, включая акселерационные программы для поддержки предпринимательской активности в сфере информационных технологий.
Ранее сообщалось, что правительство РК одобрило проект концепции развития искусственного интеллекта.