Мінцифри разом із "Київстаром" обрали модель Gemma від Google для тренування національної LLM
Міністерство цифрової трансформації разом з найбільшим українським оператором мобільного зв’язку "Київстар" обрали модель Gemma 3 від Google (відкрита ШІ-модель) для тренування української LLM (велика мовна модель – ІФ-У), повідомив перший віцепремʼєр-міністр цифрової трансформації Михайло Федоров.
"Разом з Kyivstar обрали велику мовну модель, на якій попередньо навчимо національну українську LLM. Нею стане Gemma 3 від Google", - написав Федоров у Телеграм-каналі в понеділок.
За його словами, перевагами Gemma є оптимальний баланс продуктивності та ресурсів, підтримка української мови та функціонування не тільки з текстом, а й із зображеннями.
У пресрелізі "Київстар" зазначається, що планується покращити роботу моделі з українською мовою, що зменшить помилки під час створення україномовних текстів та оптимізує обчислювальні витрати при використанні моделі. Також у планах - донавчити модель на україномовних текстах, які зараз збирають експерти та створити бенчмарки (тести) для більш точного налаштування моделі для подальшого використання.
"Модель підтримує понад 140 мов разом із українською, має до 128 тис. токенів, мультимодальні можливості та гнучку архітектуру, що дозволяє адаптувати її під різні завдання", - додав у релізі директор з розробки диджитал-продуктів Київстар Михайло Нестор.
Своєю чергою Chief AI Officer Мінцифри та CEO WINWIN AI Center of Excellence Данило Цьвок пояснив, що під час вибору моделі орієнтувалися на те, як модель вже опрацьовує тексти українською мовою та її контрольованість при донавчанні.
За його словами, це допоможе мінімізувати лінгвістичні та етичні ризики в українській LLM.
У своєму релізі "Київстар" нагадав, що модель Gemma вже продемонструвала результати як базова модель для MamayLM та Lapa LLM – перших українських LLM, а також для INSAIT BgGPT – сучасної LLM для болгарської мови.