TL;DR. 2024 год определят несколько параллельных трендов: рост мультимодальных моделей, появление малых специализированных LLM, развитие агентных систем и активная регуляторная фаза.
Ключевые выводы
- Мультимодальность. Модели обрабатывают текст, изображения, аудио и видео в едином пространстве представлений.
- Малые модели. Специализированные модели на 1–10 млрд параметров приближаются к качеству фронтирных LLM в конкретных доменах.
- Агенты. ИИ переходит от ответов на запросы к выполнению многошаговых задач.
- Регулирование. Закон ЕС об ИИ вступает в действие; появляются национальные рамки.
Тренд 1: мультимодальность как стандарт #
От текста к мультимедиа #
GPT-4V, Gemini 1.5 и Claude 3 в 2024 году делают мультимодальный ввод стандартом. Модели одновременно работают с текстом, изображениями, документами, аудио и видео, что открывает новые сценарии: анализ чеков и квитанций, понимание чертежей, обработка многоязычных аудиозаписей.
Тренд 2: малые специализированные модели #
Эффективность как конкурентное преимущество #
Mistral 7B, Phi-2, Llama-3 8B показывают, что модели на порядок меньшие, чем GPT-4, могут приближаться к её качеству в конкретных задачах. Для банков это означает возможность разворачивать модели в собственном периметре с разумными требованиями к инфраструктуре.
Тренд 3: агентные системы #
От ответов к действиям #
Агенты — LLM, способные многошагово планировать и выполнять действия (звонки в API, поиск, написание и проверка кода) — становятся главной темой 2024 года. В банках первые агенты появляются в задачах поддержки клиентов и автоматизации внутренних процессов.
Тренд 4: регулирование #
Активная фаза #
Закон ЕС об ИИ принят и переходит к стадии имплементации. США, Великобритания, Канада, Япония и другие юрисдикции разрабатывают собственные подходы. Банки обязаны строить системы управления ИИ-моделями с учётом будущих требований к прозрачности, объяснимости и оценке рисков.
Тренд 5: ответственный ИИ #
От принципов к практике #
«Ответственный ИИ» перестаёт быть лозунгом и превращается в инженерную дисциплину: автоматическое тестирование на предвзятость, мониторинг дрейфа, человек в цикле принятия решений, документирование данных и моделей.
Заключение #
2024 год — это не «следующая итерация LLM», а фаза, в которой ИИ становится инфраструктурным слоем корпоративных систем. Банкам, не успевшим выстроить базовые возможности в 2023 году, придётся быстро навёрстывать.
Последняя проверка .