
27.12.2024
Дата публикации
Завершено обучение большой языковой модели KazLLM на основе 148 миллиардов токенов на казахском, английском, русском и турецком языках. Модель разработана командой Института Умных Систем и Искусственного Интеллекта (ISSAI) при поддержке и координации МЦРИАП РК и МНВО РК.
Свой вклад в реализацию этого проекта внесли такие лингвистические институты и научно-производственные организации, как Тил Казына, АО «НИТ», Maqsut Narikbayev University и др. институты.
По инициативе Президента РК, KazLLM станет основой для создания более масштабного проекта — TurkLLM, направленного на развитие технологий обработки естественного языка в тюркоязычном пространстве.
На проект большой языковой модели было выделено почти 4 млрд тенге.
На первом этапе KazLLM будет доступна в открытом доступе для разработчиков, стартапов и компаний, чтобы стимулировать создание продуктов и сервисов на ее основе.
Ключевую роль в создании технологии сыграли Beeline Казахстан и QazCode, предоставившие вычислительные мощности на базе серверов DGX H100. Эти ресурсы позволили сократить процесс обучения до 50 дней, обеспечив высокую производительность модели.
KazLLM открывает перспективы для автоматизации различных сфер. Компании смогут разрабатывать чат-боты, улучшать клиентские сервисы, анализировать большие объемы данных и создавать образовательные платформы для изучения казахского языка.
Сейчас тестируется ИИ-помощник в eGov, который должен упростить процесс получения информации и взаимодействия с госорганами. В проект внедрена языковая модель KazLLM. Воспользоваться услугой можно будет на казахском и русском языках.
«Вы можете голосом или текстом набрать услугу, которая вам необходима, и мы выведем вас на нее. Необязательно точно знать название услуги. Достаточно, например, набрать: у меня родился ребенок. Что делать? Наш чат-бот выдаст ссылку на услугу и сразу же, как зарегистрировать его», — сообщил главный архитектор баз данных АО «НИТ» Алиби Джангильдин.
Свой вклад в реализацию этого проекта внесли такие лингвистические институты и научно-производственные организации, как Тил Казына, АО «НИТ», Maqsut Narikbayev University и др. институты.
По инициативе Президента РК, KazLLM станет основой для создания более масштабного проекта — TurkLLM, направленного на развитие технологий обработки естественного языка в тюркоязычном пространстве.
На проект большой языковой модели было выделено почти 4 млрд тенге.
На первом этапе KazLLM будет доступна в открытом доступе для разработчиков, стартапов и компаний, чтобы стимулировать создание продуктов и сервисов на ее основе.
Ключевую роль в создании технологии сыграли Beeline Казахстан и QazCode, предоставившие вычислительные мощности на базе серверов DGX H100. Эти ресурсы позволили сократить процесс обучения до 50 дней, обеспечив высокую производительность модели.
KazLLM открывает перспективы для автоматизации различных сфер. Компании смогут разрабатывать чат-боты, улучшать клиентские сервисы, анализировать большие объемы данных и создавать образовательные платформы для изучения казахского языка.
Сейчас тестируется ИИ-помощник в eGov, который должен упростить процесс получения информации и взаимодействия с госорганами. В проект внедрена языковая модель KazLLM. Воспользоваться услугой можно будет на казахском и русском языках.
«Вы можете голосом или текстом набрать услугу, которая вам необходима, и мы выведем вас на нее. Необязательно точно знать название услуги. Достаточно, например, набрать: у меня родился ребенок. Что делать? Наш чат-бот выдаст ссылку на услугу и сразу же, как зарегистрировать его», — сообщил главный архитектор баз данных АО «НИТ» Алиби Джангильдин.