TL;DR. Gemma — открытая модель Google, дистиллированная из исследований Gemini. Доступна в вариантах 2B и 7B параметров и пригодна для локального развёртывания, что особенно важно для банковских сценариев.
Ключевые выводы
- Идея. Google открывает доступ к собственным исследованиям через дистиллированные модели.
- Подход. Два размера (2B и 7B), оба пригодны к запуску на потребительском оборудовании.
- Влияние. Открывает дорогу к локальному развёртыванию в банках без отправки данных в облако.
Контекст #
Открытые модели как тренд #
В 2024 году крупные игроки — Meta (Llama), Mistral, Google (Gemma), Microsoft (Phi) — выпускают открытые модели для использования сообществом. Это не благотворительность: открытые модели формируют экосистему вокруг проприетарных платформ и стандартизируют интерфейсы.
Идея #
Что предлагает Gemma #
Gemma выпущена в двух размерах:
- Gemma 2B — 2 миллиарда параметров, запускается на потребительском GPU и даже на CPU
- Gemma 7B — 7 миллиардов параметров, требует профессионального GPU, но даёт качество, сравнимое с фронтирными моделями на ряде задач
Подход #
Дистилляция из Gemini #
Gemma построена на тех же исследовательских принципах, что и Gemini, но размеры моделей значительно меньше. Это типичная техника дистилляции: меньшая модель учится повторять поведение большей.
Влияние #
Сценарии в банке #
Открытая модель критически важна для банковских сценариев:
- Локальное развёртывание. Данные клиентов не покидают периметр банка
- Регуляторная прозрачность. Можно подвергать модель аудиту
- Кастомизация. Файн-тюнинг под специфические задачи банка
- Стоимость. Нет per-token-оплаты при больших объёмах
Лицензия #
Условия использования #
Gemma выпущена под собственной лицензией Google, позволяющей коммерческое использование, но с ограничениями (например, запрет на создание конкурирующих моделей путём дистилляции).
Заключение #
Gemma — важный шаг к доступности продвинутого ИИ для банков, которые не могут или не хотят отправлять данные в облачные API. В 2024 году у банков впервые появляется реальный выбор между качеством фронтирных проприетарных моделей и контролем над данными.
Последняя проверка .