Индекс agentic AI для банков в 2026 году: измерение автономии

TL;DR. Шестимерный индекс готовности банков к agentic AI: уровни автономии, governance, регуляторные доказательства, экономика, готовность и глобальное соответствие.

Points clés

Зачем нужен этот индекс. Индекс Evident AI ранжирует 50 глобальных банков по таланту, инновациям, лидерству и прозрачности, опираясь на миллионы общедоступных данных.
Ландшафт зрелости агентного ИИ в 2026 году. Отчёт Cambridge CCAF 2026 года — крупнейшее в мире исследование ИИ в финансовых услугах, охватившее 628 организаций в 151 юрисдикции в партнёрстве с BIS, IMF, WEF и Всемирным банком, — обеспечивает статистическую…
Архитектура шестимерного индекса. Этот индекс оценивает готовность к агентному ИИ по шести измерениям.
Сводная индексная оценка. Шесть оценок по измерениям объединяются в сводный индекс с использованием следующих весов по регуляторной существенности:.

Агентный ИИ в банковской сфере перешёл из эксперимента в операционную инфраструктуру. В 2026 году вопрос уже не в том, внедрять ли его — 52% финансовых организаций уже это сделали, — а в том, способна ли отрасль измерять созданное с той же строгостью, какую она применяет к капиталу, кредиту и ликвидности. Этот индекс и есть такая измерительная система (Cambridge CCAF, 2026).

Резюме для руководства / Ключевые выводы

Автономность — это новая достаточность капитала. Подобно тому как Базель задал измеримые стандарты финансовой устойчивости, отрасли теперь нужен измеримый стандарт автономного принятия решений. Этот индекс — первая межизмеренческая система, оценивающая готовность к агентному ИИ по управлению, технической архитектуре, регуляторным доказательствам, экономической отдаче и организационной зрелости как единую операционную модель.

52% внедрения маскируют 14% реальной трансформации. Опрос Cambridge CCAF 2026 года, охвативший 628 организаций в 151 юрисдикции, показывает, что хотя четыре из пяти финансовых организаций внедряют ИИ, лишь 14% описывают его как преобразующий их конкурентные позиции. Разрыв — в управлении, а не в технологии.

OSWorld на уровне 66,3% — это потолок надёжности, а не пол. Бенчмарк Stanford HAI 2026 года показывает, что ИИ-агенты выполняют 66,3% структурированных корпоративных задач (Stanford HAI, 2026). Три связанных вызова инструмента при такой надёжности в совокупности дают 29% сквозной успешности. Неконтролируемое исполнение в действующих платёжных системах при таком уровне надёжности не выдерживает защиты.

FSB высказался. 10 июня 2026 года Совет по финансовой стабильности опубликовал первую операционную систему управления агентным ИИ в финансовых услугах (FSB, 2026) — 12 рекомендуемых практик, охватывающих подотчётность совета директоров, управление жизненным циклом и архитектуры «ИИ-мониторит-ИИ». Приём комментариев закрывается 22 июля 2026 года.

Часы исполнения EU AI Act запущены. Обязательства для систем ИИ высокого риска по Приложению III вступают в силу 2 августа 2026 года (руководство по EU AI Act, 2026). Финансовые организации, эксплуатирующие агентный ИИ в ЕС без идентичности в журнале аудита для каждого агента, документированных процедур отзыва прав и доказательств уровня совета директоров, находятся в просрочке.

JP Morgan назвал год. Дерек Уолдрон, директор по аналитике, 9 июня 2026 года подтвердил CNBC, что банк развернёт долгоработающих автономных агентов (CNBC, 2026) — способных работать самостоятельно от одного до двух часов — в течение 2026 года. Это заявление меняет конкурентную рамку для каждой организации, ориентирующейся на него.

Индекс оценивает шесть измерений. Уровень автономности, архитектура управления, регуляторные доказательства, экономическая подотчётность, организационная готовность и глобальное регуляторное соответствие. Вместе они превращают ИИ-программу из портфеля инициатив в измеримую способность.

Зачем нужен этот индекс

Индекс Evident AI ранжирует 50 глобальных банков по таланту, инновациям, лидерству и прозрачности, опираясь на миллионы общедоступных данных. Это наиболее авторитетный внешний бенчмарк зрелости ИИ в финансовых услугах. Чего он не делает — намеренно — так это не оценивает конкретную инженерную и управленческую архитектуру, которая делает агентный ИИ безопасным для развёртывания в действующих банковских API. Stanford AI Index отслеживает результаты исследований, техническую производительность и общественное влияние. Чего он не делает — так это не переводит проценты выполнения задач OSWorld в операционный набор инструкций для казначея, директора по рискам или команды валидации моделей.

Этот индекс закрывает данный разрыв. Он берёт дисциплину измеримости из стэнфордской системы, конкурентный контекст индекса Evident и регуляторную конкретику SR 11-7, SS1/23, EU AI Act, рекомендуемых практик FSB и сингапурской Model AI Governance Framework for Agentic AI от IMDA — и превращает их в шестимерную модель оценки, по которой может действовать совет директоров.

Практическим триггером служит то, что агентный ИИ сместился из плоскости планирования в плоскость аудита. Когда директор по аналитике JP Morgan объявляет о развёртывании долгоработающих автономных агентов в том же году, когда DBS встраивает плоскости управления агентами в подготовку кредитных меморандумов и обслуживание клиентов, когда FSB предписывает, что агенты, исполняющие финансовые транзакции, требуют «одобрения человеком или двойной авторизации сверх пороговой суммы, ограниченного доступа агентов к платёжным системам и аудиторских следов каждой агентской транзакции», — организация, не способная оценить собственную позицию, обнаружит, что её оценивает регулятор.

Ландшафт зрелости агентного ИИ в 2026 году

Что показывают данные

Отчёт Cambridge CCAF 2026 года — крупнейшее в мире исследование ИИ в финансовых услугах, охватившее 628 организаций в 151 юрисдикции в партнёрстве с BIS, IMF, WEF и Всемирным банком, — обеспечивает статистическую основу для этого индекса.

Сигнал	Вывод	Источник
Активное внедрение ИИ	81% финансовых фирм внедряют ИИ на том или ином уровне	Cambridge CCAF
Внедрение агентного ИИ	52% уже пилотируют или развёртывают агентные системы, способные к устойчивому многошаговому автономному действию	Cambridge CCAF
Доля трансформации	Лишь 14% описывают ИИ как переопределяющий их конкурентное преимущество	Cambridge CCAF
Сложность измерения	55% участников отрасли и 63% регуляторов испытывают трудности с измерением ценности внедрения ИИ; среди крупных финансовых организаций — 76%	Cambridge CCAF
Прибыльность	Лишь 40% сообщают о росте прибыльности от ИИ; 43% не отмечают изменений	Cambridge CCAF
Утрата человеческого надзора	51% называют утрату человеческого надзора одним из главных рисков	Cambridge CCAF
Агентные сценарии использования	31% новых банковских сценариев ИИ в I квартале 2026 года были агентными приложениями — рекордный показатель, рост с 15% в IV квартале 2025 года	Evident Insights
Разрыв в управлении	77% из 2000 технологических руководителей говорят, что внедрение ИИ опережает возможности управления; в среднем 54 инцидента с ИИ-агентами на предприятие в 2025 году	IBM
Разрастание агентов	Предприятия ожидают развернуть в среднем 1661 ИИ-агента к 2027 году; лишь 11% заявляют о полной готовности	IBM
Риск пула прибыли по McKinsey	Агентный ИИ может снизить операционные издержки банков на 20%, но грозит размыть до 170 млрд долл. глобальных пулов прибыли к 2030 году, если бизнес-модели не адаптируются	McKinsey

Эти цифры точно очерчивают проблему: внедрение опережает управление, прирост производительности заметен, трансформация редка, а разрыв в измеримости наиболее широк там, где регуляторные ставки наиболее высоки, — у крупных финансовых организаций.

Где конкуренты проводят границы

Индекс Evident AI 2025 года поставил JP Morgan Chase на первое место (оценка 79), за ним Capital One (78,1), RBC (58,4), CommBank Australia (53,9) и Morgan Stanley (52,2). Индекс измеряет четыре опоры способностей — талант, инновации, лидерство, прозрачность, — а не операционную архитектуру агентов. Это создаёт структурный разрыв: банк может получить высокую оценку за раскрытие инноваций, развёртывая при этом агентов без аварийного выключателя, без журнала аудита WORM и без политического шлюза OPA. Этот индекс призван сделать такой разрыв видимым.

Отчёт Deloitte Tech Trends 2026 года сообщает, что лишь 11% организаций имеют агентный ИИ в продуктиве. McKinsey обнаруживает, что лишь примерно одна треть организаций достигает уровня зрелости управления три или выше в контроле агентного ИИ, даже при том что технические возможности растут стремительно. Данные опроса CCG Catalyst показывают, что 93% связанных с ИИ расходов идут на технологическую инфраструктуру и лишь 7% — на людей, таланты, обучение, управление изменениями и управление, — соотношение, делающее масштабирование структурно невозможным.

Evident Venture Tracker за I квартал 2026 года называет Anthropic наиболее упоминаемым поставщиком, при этом длинный хвост специализированных игроков обеспечивает 68% всех развёртываний, в основном нацеленных на узкоспециализированные сценарии в кредитовании, противодействии отмыванию денег и казначействе. Сторона предложения зрела. Сторона управления — нет.

Архитектура шестимерного индекса

Этот индекс оценивает готовность к агентному ИИ по шести измерениям. У каждого измерения четырёхуровневая шкала зрелости. Индексная оценка банка есть произведение его оценок по измерениям, взвешенных по регуляторной существенности. Система весов откалибрована по SR 11-7, SS1/23, обязательствам Приложения III EU AI Act и категориям рекомендуемых практик FSB.

Измерение 1: Охват уровней автономности

Что измеряется: Классифицирован ли каждый продуктивный агентный рабочий процесс на определённой лестнице автономности, при отсутствии процессов, работающих выше разрешённого уровня без документированного исключения, — и определяет ли это присвоение уровня не только границы задач, но и границы юридической подотчётности.

Лестница автономности остаётся фундаментальной конструкцией. Пять уровней — от уровня 0 (наблюдение и только чтение) до уровня 4 (оркестрация множества инструментов с обязательными контрольными точками) — определяют границу прав агента, а не сложность модели. Одна и та же базовая LLM может находиться на любом уровне; различается обёртка. Уровень 5 — самооркеструемое исполнение без контрольных точек — не должен существовать в продуктивной банковской среде в 2026 году. OSWorld с выполнением 66,3% задач даёт мультипликативный эффект: три связанных вызова по 66% каждый дают 29% сквозной успешности. Пять звеньев дают 13%.

Сингапурская Model AI Governance Framework for Agentic AI от IMDA, опубликованная в Давосе 22 января 2026 года как первая в мире система управления, прямо адресующая автономных агентов (IMDA, 2026), определяет четыре эквивалентных понятия: иерархия принципала (кто вправе инструктировать агента), граница задачи (что агенту разрешено делать), минимальный след (агент не должен накапливать права сверх непосредственной необходимости) и объяснимость (пути рассуждения должны быть прослеживаемы). Эти четыре напрямую отображаются на модель уровней автономности.

Проблема «принципал-агент» и юридическая атрибуция намерения. Система IMDA вводит измерение, которое чисто инженерные спецификации недооценивают: когда ИИ-агент действует как доверенное лицо корпоративного субъекта — исполняя платёж, одобряя корректировку кредитного лимита, подавая регуляторную отчётность, — он создаёт юридическую проблему атрибуции намерения. Под чьей властью действовал агент? Кто несёт ответственность, когда агент отклоняется от ограничений своего промпта? Чьё намерение атрибутируется, когда агент выбирает между двумя действительными, но разными интерпретациями неоднозначной инструкции?

Для рабочих процессов уровня 3 и уровня 4 — где агент автономно исполняет значимые действия в рамках определённых параметров — определение уровня должно задавать не только техническую границу задачи, но и границу юридической подотчётности: поимённо названного человека-принципала, авторизовавшего процесс, документированный инструмент делегирования (решение совета директоров, делегирование полномочий или подписанный мандат), условия, при которых действия агента связывают организацию обязательствами, и условия, при которых отклонение от ограничений промпта запускает автоматический откат, эскалацию и регистрацию инцидента. Без этого классификация уровня автономности — лишь инженерный артефакт, который не переживёт юридического спора, регуляторной проверки или конфликта с контрагентом, чьи средства переместились из-за того, что агент неверно истолковал условную инструкцию.

Уровень зрелости	Как это выглядит	Индексная оценка
Уровень 1 — Неклассифицировано	Нет формальной таксономии; агенты неформально описываются как «помощники» или «второй пилот»; нет документации по уровням	0–24
Уровень 2 — Классифицировано, не валидировано	Метки уровней присвоены; нет формальной валидации того, что обёртка обеспечивает заявленный уровень; рабочие процессы уровня 5 могут существовать незамеченными	25–49
Уровень 3 — Классифицировано и контролируется	Все продуктивные процессы помечены уровнями 0–4; уровень 5 запрещён договором; ежеквартальные артефакты аудита уровней доступны для проверки MRM (управление модельным риском)	50–74
Уровень 4 — Классифицировано, контролируется и готово к доказательству	Полный реестр уровней; непрерывный мониторинг дрейфа; любая переклассификация уровня запускает новую валидацию MRM; аудитор может по запросу реконструировать присвоение уровня для любого процесса	75–100

Измерение 2: Архитектура управления

Что измеряется: Полностью ли спроектирована и работает ли в продуктиве пятикомпонентная плоскость управления агентами — а не описана в документе политики.

Консультация FSB от июня 2026 года прямо заявляет, что существующие системы управления не проектировались для систем, которые «планируют, предпринимают многошаговые действия и взаимодействуют с внешними системами без пошагового человеческого надзора». Пятикомпонентная плоскость управления переводит это наблюдение в инженерный чек-лист:

Компонент 1: Идентичность и права. Каждый агент сопоставляется ровно с одной служебной учётной записью с токенами OAuth client_credentials, ограниченными минимальной поверхностью API. Токен агента заморозки карт может вызывать POST /accounts/{id}/freeze с потолком суммы; он не может вызывать ничего в кастоди, казначействе или трейдинге. Секреты служебных учётных записей ротируются по определённому циклу. Долгоживущие учётные данные — самый частый отказ плоскости управления в продуктивных развёртываниях. FSB прямо рекомендует «наименьшие привилегии для агентов и их субагентов, а также динамическое управление идентичностью и доступом, которое предоставляет, изменяет или отзывает права в реальном времени на основе поведения и контекста, а не статических профилей, используемых для людей».

Компонент 2: Детерминированные защитные ограничения. Каждый вызов инструмента LLM проходит через семантический маршрутизатор (NeMo Guardrails, LangChain Guardrails или эквивалент), прежде чем достигнуть продуктивного API. Маршрутизатор классифицирует намерение по конечному списку разрешённого и отклоняет вызовы вне этого списка. Затем валидатор JSON-схемы проверяет полезную нагрузку. pacs.008 с amount: 0 — это отказ модели, а не легитимная транзакция. Как и перевод в страну, не одобренную заранее для исходного клиентского сегмента.

Компонент 3: Политика как код. Open Policy Agent (или эквивалент) располагается между валидатором и API. Политики версионируются в Git; решения об отклонении логируются; тот же движок политик, который контролирует вызовы между микросервисами на существующей платформе, контролирует и вызовы инструментов агентами. Руководство EU AI Office от мая 2026 года по аудиторскому логированию согласно Статье 12 требует, чтобы записи журнала для систем ИИ высокого риска атрибутировали действия конкретному экземпляру агента, а не просто развёртыванию или учётным данным API. Многоагентные развёртывания с общими учётными данными не проходят эту проверку.

Компонент 4: Полнота аудита. Неизменяемое хранилище WORM — S3 Object Lock, неизменяемость Azure Blob или реестровая база данных. Каждый вызов фиксирует: временную метку, ID агента, ID служебной учётной записи, хеш системного промпта, извлечённый контекст, провайдера LLM плюс модель плюс версию, сырой вывод LLM, разобранный вызов инструмента, решение OPA, ответ API, нижестоящий эффект и UID одобряющего, где применимо. Записи криптографически подписываются в момент записи. Разъяснение к Статье 12 EU AI Act, опубликованное в мае 2026 года, называет идентичность каждого агента отдельным пробелом; организации, эксплуатирующие несколько экземпляров агентов с общими учётными данными, прямо находятся вне соответствия.

Компонент 5: Аварийный выключатель и «ИИ-мониторит-ИИ». Протестированный API «красной кнопки», отменяющий все исполняющиеся вызовы агентов в рамках класса прав менее чем за 60 секунд. Слово протестированный несёт смысловую нагрузку. Непротестированный аварийный выключатель — это лишь декларация в политике.

Помимо аварийного выключателя, на высшем уровне зрелости Измерение 2 должно предписывать архитектуру «ИИ-мониторит-ИИ» (AMI) — и причина арифметическая. Данные IBM оценивают среднюю популяцию агентов на предприятии в 1661 к 2027 году (IBM, 2026). FSB прямо признаёт, что непрерывный человеческий мониторинг отдельных решений агентов становится физически невозможным при масштабе, и рекомендует дополнять человеческий надзор ИИ-системами, которые предупреждают людей при нарушении метрик производительности или дрейфе поведения агентов. Человек-комплаенс-офицер не может мониторить 1661 одновременных агентов, исполняющих решения с машинной скоростью. Модель контроля, исходящая из того, что он может, откажет в первый же раз, когда популяция агентов претерпит коррелированный поведенческий сдвиг — когда обновление модели тихо изменит распределения выводов в десятках процессов одновременно.

Слой AMI не заменяет человеческий надзор; это механизм обнаружения, делающий человеческий надзор действенным при масштабе. Его три обязательные функции: обнаружение дрейфа (статистический мониторинг распределения выводов среди агентов одного уровня и типа, помечающий отклонения сверх заданного сигма-порога раньше, чем их мог бы заметить человек); оповещение о межагентной корреляции (выявление того, что несколько агентов начинают исполнять задачи в направленно согласованном паттерне, отсутствовавшем вчера, — ранний сигнал эффекта стадности, описанного в Измерении 6); и предэскалация аномалий (генерация структурированного оповещения с контекстом и оценкой обратимости человеку, принимающему решения, до того как аварийный выключатель останется единственным вариантом). FSB прямо рекомендует архитектуры AMI в Рекомендуемой практике 9. Организация, достигшая уровня зрелости 4 в Измерении 2 без действующего слоя AMI, не находится на уровне 4.

Уровень зрелости	Как это выглядит	Индексная оценка
Уровень 1 — Бессистемно	Некоторые компоненты присутствуют, но не задокументированы; нет формального владельца плоскости управления; нет записи о тестировании аварийного выключателя	0–24
Уровень 2 — Задокументировано	Все пять компонентов задокументированы; пробелы в реализации существуют; аварийный выключатель есть, но не протестирован; журналы WORM неполны	25–49
Уровень 3 — Действует	Все пять компонентов работают в продуктиве; аварийный выключатель тестируется ежеквартально; журналы WORM полны для процессов уровня 3+; политики OPA под контролем версий	50–74
Уровень 4 — Готово к доказательству	Плоскость управления генерирует непрерывные криптографически подписанные доказательства; идентичность каждого агента удовлетворяет Статье 12 EU AI Act; результаты тестов аварийного выключателя — аудиторские артефакты; обнаружение дрейфа автоматизировано	75–100

Измерение 3: Полнота регуляторных доказательств

Что измеряется: Способна ли организация по запросу предоставить полный пакет регуляторных доказательств по каждому процессу для SR 11-7, SS1/23, EU AI Act, DORA, FSB и применимых национальных систем.

Федеральная резервная система неоднократно разъясняла, что SR 11-7 применяется к любой системе принятия решений «вход-выход» независимо от того, классифицирует ли организация базовую LLM как модель. SS1/23 от PRA ещё шире. Классификация высокого риска по Приложению III EU AI Act охватывает большинство сценариев LLM в финансовых услугах — кредитный скоринг, выявление мошенничества, оценку пригодности клиента, ценообразование страхования. Полное соответствие для систем в сфере действия ЕС требуется к 2 августа 2026 года, при этом Германия, Франция и Нидерланды подтвердили надзорные проверки на III квартал 2026 года. IOSCO Supervisory Toolkit for AI Use in Capital Markets, финализированный 25 мая 2026 года, охватывает весь жизненный цикл ИИ от традиционного ML через GenAI до агентного ИИ — и прямо отмечает, что способности к планированию, долгосрочная память и доступ к внешним инструментам создают риски эмерджентного поведения и каскадных отказов во взаимосвязанных системах.

Модель трёх линий защиты, применённая к агентам:

Первая линия (владелец модели): Документирует целевое использование, происхождение обучающих и оценочных данных, схему системного промпта, список разрешённых вызовов инструментов, результаты тестов аварийного выключателя. Владеет мониторингом дрейфа в продуктиве. Владеет банк-специфичным отложенным оценочным набором — работой, в которую большинство организаций недоинвестируют.
Вторая линия (команда MRM): Валидирует агента до продуктива. Отчёт о валидации охватывает оценки вендора (MMLU, HumanEval — полезные, но недостаточные), банк-специфичные оценки, результаты red-team по инъекции промптов, анализ предвзятости и справедливости и количественную формулировку остаточного риска.
Третья линия (внутренний аудит): Тестирует шлюзы плоскости управления и полноту журнала аудита на выборке продуктивных решений. Аудиторский цикл 2027 года будет существенно отличаться от 2025 года; планируйте бюджет соответственно.

Сингапурская Model AI Governance Framework for Agentic AI (MGF) требует от финансовых организаций оценивать агентов по четырём измерениям: ограничение автономности и доступа агента, установление человеческой подотчётности в определённых контрольных точках, внедрение технических средств контроля, включая базовое тестирование, и обеспечение ответственности конечного пользователя через прозрачность. AI Risk Management Toolkit от MAS от марта 2026 года — разработанный в рамках Project MindForge с 24 организациями — представляет наиболее операционно детализированное руководство национального уровня из доступных.

Уровень зрелости	Как это выглядит	Индексная оценка
Уровень 1 — Осведомлённость о комплаенсе	Регуляторные обязательства выявлены; доказательства уровня процесса не производятся; карточки моделей SR 11-7 отсутствуют или неполны	0–24
Уровень 2 — Валидация в точке времени	Преддеплойная валидация завершена; доказательства существуют на дату развёртывания; нет непрерывного мониторинга; нет регулярного производства доказательств по каждому процессу	25–49
Уровень 3 — Непрерывные доказательства	Карточки моделей ведутся по каждому процессу; непрерывные наборы оценок перезапускаются еженедельно; логирование по каждому агенту согласно Статье 12 EU AI Act действует; категории рекомендуемых практик FSB сопоставлены с внутренними средствами контроля	50–74
Уровень 4 — Готово к проверяющему	Полный пакет регуляторных доказательств извлекается по запросу для каждого процесса; записи валидации по трём линиям защиты актуальны; банк-специфичный набор оценок ловит регрессии от обновлений модели быстрее, чем циклы релизов вендора; четырёхмерное сопоставление MAS MGF завершено	75–100

Измерение 4: Экономическая подотчётность

Что измеряется: Измеряет ли организация отдачу от агентного ИИ через юнит-экономику уровня процесса, а не через заявления о производительности уровня программы.

Анализ McKinsey показывает, что агентный ИИ может снизить операционные издержки банков на 15–20% (McKinsey, 2026) — что эквивалентно 9–15% операционной прибыли, — но что большая часть этого выигрыша будет вытеснена конкуренцией. Более устойчивое конкурентное преимущество — у организаций, которые строят измерительную инфраструктуру, чтобы действовать быстрее конкурентов, когда становятся доступны улучшения моделей и процессов. Вывод Cambridge CCAF о том, что 76% крупных финансовых организаций не могут измерить ценность внедрения ИИ, — это не проблема качества данных. Это проблема архитектуры подотчётности: программы бюджетируются и отчитываются на уровне портфеля, что делает невозможным проследить ценность или отказ до отдельных процессов.

Четыре юнит-экономические метрики, выдерживающие разговор с финансовым директором:

Стоимость одного завершённого решения, включая стоимость отката и исправления неудачных решений. Агент, составляющий SAR (отчёт о подозрительной активности), который сокращает время BSA-офицера на 40%, но генерирует 12% ложноположительных отчётов, уничтожил ценность, а не создал её. Это та метрика, которую вывод Deloitte — что 93% расходов на ИИ идут на инфраструктуру и лишь 7% на людей и управление — делает неизмеримой: организации не могут рассчитать стоимость отката от управленческого сбоя, который они не оснастили средствами обнаружения.

Избегнутые ручные касания, подсчитанные за вычетом новых касаний, создаваемых надзором плоскости управления и обработкой исключений. Цель не в том, чтобы минимизировать человеческое внимание; цель — перенаправить его на решения с большим рычагом.

Доля откатов — процент исполненных агентом действий, отменённых в течение 24 часов. Процесс уровня 3 с долей откатов выше 2% — проблема надёжности. Выше 5% — проблема плоскости управления. Этот показатель следует отслеживать по каждому процессу, а не по программе. Среднее по портфелю скрывает выброс, который породит следующее аудиторское замечание.

Полнота аудиторского следа — процент решений с полным происхождением, реконструируемым из журнала WORM. Должна быть 100% для процессов уровня 3 и уровня 4. Меньше — это сбой политики.

Рынок агентного ИИ в банковской сфере растёт темпами, делающими эту измерительную инфраструктуру неотложной. Отчёт Newgen Banking Trends 2026 года прогнозирует рост рынка агентного ИИ с 2,1 млрд до 81 млрд долл. к 2034 году. Сценарное моделирование McKinsey указывает, что наиболее вероятный исход — сценарий с вероятностью 30% — предполагает достижение ИИ-агентами соотношения агентов к людям примерно 20:1 и генерацию снижения издержек на 15–20%. Пионеры могут открыть разрыв в 4 процентных пункта ROTE относительно медлительных. Эта маржа реальна, но она измерима и защитима лишь при отслеживании юнит-экономики на уровне процесса.

Уровень зрелости	Как это выглядит	Индексная оценка
Уровень 1 — Отчётность на уровне бюджета	Расходы на ИИ отслеживаются; нет юнит-экономики уровня процесса; заявления о производительности не проверены относительно операционных базисов	0–24
Уровень 2 — Агрегированные метрики	Доступны метрики производительности и издержек уровня программы; доля откатов не отслеживается по процессам; отчётность для финансового директора опирается на избегнутую численность персонала	25–49
Уровень 3 — Отслеживание на уровне процесса	Стоимость одного завершённого решения отслеживается по каждому процессу; доля откатов мониторится; избегнутые ручные касания рассчитываются за вычетом накладных расходов плоскости управления	50–74
Уровень 4 — Полная экономическая подотчётность	Все четыре юнит-экономические метрики отслеживаются по каждому процессу; доли откатов выше 2% запускают автоматический пересмотр процесса; полнота аудиторского следа — метрика дашборда, отчитываемая совету директоров ежеквартально	75–100

Измерение 5: Организационная готовность

Что измеряется: Обладает ли организация талантами, кросс-функциональным управлением, отчётностью уровня совета директоров и культурой, чтобы развёртывать и поддерживать агентный ИИ в масштабе, — а не только пилотировать его.

Вывод Cambridge CCAF точен: готовность персонала вчетверо более предсказательна для прибыльности ИИ, чем закупка технологий. Фирмы с высокоподготовленным персоналом сообщают о 23% прибыльности ИИ; фирмы без него — о 6%. Лишь 10% всех фирм описывают свой персонал как готовый. Финтехи достигают стадии трансформации втрое чаще традиционных финансовых организаций — 19% против 6%, — несмотря на то что многие тратят менее 10 000 долл. в год на ИИ. Дифференциатором является архитектура, а не бюджет.

McKinsey описывает три стратегические позиции для банков перед лицом агентного ИИ: выжидать, адаптироваться, став поставщиком продуктов за агентными интерфейсами, или конкурировать за владение прямыми отношениями с клиентом. Большинство банков по умолчанию занимают первую позицию, представляя себя преследующими третью. Стратегический разговор должен быть явным, и его место — совет директоров.

Рекомендуемая практика FSB 1 прямо адресует подотчётность совета директоров: советы несут конечную ответственность за управление ИИ, задание риск-аппетита и обеспечение ясности структур подотчётности. Исполнение Статьи 5 EU AI Act и положения о ответственности совета по Статье 5 DORA переводят этот принцип в личную ответственность. Supervisory Toolkit от IOSCO от мая 2026 года заявляет, что «системы ИИ более не являются изолированными проектами. Это базовая операционная инфраструктура, требующая непрерывной валидации, управления на уровне совета директоров и надзорных доказательств, готовых к инспекции».

Система отчётности совету директоров по агентному ИИ должна охватывать четыре числа по каждому процессу: уровень автономности, полноту аудиторского следа, долю откатов и чистую стоимость одного решения. Плюс топ-5 остаточных рисков. Слайды из документа политики этому не замена.

Уровень зрелости	Как это выглядит	Индексная оценка
Уровень 1 — Осведомлённость	Совет осведомлён об ИИ-программе; нет агент-специфичного управления; роль директора по ИИ отсутствует; кросс-функциональный комитет по управлению не сформирован	0–24
Уровень 2 — Структура формируется	Создана выделенная функция управления ИИ; определена структура подотчётности; составлена формулировка риск-аппетита по ИИ; программа ИИ-грамотности персонала в зачаточном состоянии	25–49
Уровень 3 — Действующее управление	Совет получает ежеквартальный дашборд по агентному ИИ с метриками по каждому процессу; кросс-функциональный комитет по модельному риску охватывает агентов; готовность персонала отслеживается относительно бенчмарков; стенд MRM масштабирован для валидации 20+ агентов в квартал	50–74
Уровень 4 — Управление как конкурентное преимущество	Пакет доказательств для совета удовлетворяет Рекомендуемым практикам FSB 1–4 и требованиям личной ответственности по Статье 5 DORA; стенд MRM валидирует 50+ агентов в квартал; культура непрерывного совершенствования управления задокументирована в годовом отчёте; организация отвечает на консультацию FSB	75–100

Измерение 6: Глобальное регуляторное соответствие

Что измеряется: Соответствует ли операционная модель агентного ИИ организации четырём основным регуляторным системам, применимым в её основных юрисдикциях деятельности, — и подтверждено ли это соответствие доказательствами, а не утверждениями.

Регуляторный ландшафт агентного ИИ выкристаллизовался в первой половине 2026 года. Четыре системы теперь операционно существенны:

США (SR 11-7 / OCC Bulletin 2025-26). Руководство Федеральной резервной системы по управлению модельным риском применяется к любому процессу принятия решений на основе LLM. OCC опубликовало специальное руководство по управлению модельным риском для местных банков, подчёркивающее пропорциональность — «пропорциональное не означает отсутствующее». Модель трёх линий защиты применяется в полном объёме.

Великобритания (PRA SS1/23 / FCA). Принципы управления модельным риском SS1/23 от PRA достаточно широки, чтобы охватить всех агентов на основе LLM. Надзорный орган Великобритании разрабатывает специальные ожидания по агентному ИИ. FCA в числе национальных органов, выпускающих дополнительное руководство по управлению ИИ в финансовых услугах.

Европейский союз (EU AI Act / DORA). Обязательства для систем ИИ высокого риска по Приложению III действуют с 2 августа 2026 года. Требования включают структурированное управление рисками (Статья 9), управление данными (Статья 10), прозрачность (Статья 13), человеческий надзор (Статья 14) и аудиторское логирование по каждому агенту (Статья 12). Положения о ответственности совета по Статье 5 DORA применяются к операционной устойчивости, включая агентный ИИ. Руководство EU AI Office от мая 2026 года предписывает криптографическую идентичность каждого агента в журналах аудита. Несоответствие влечёт штрафы до 35 млн евро или 7% глобального оборота.

Азиатско-Тихоокеанский регион (MAS / IMDA / региональные регуляторы). Сингапурский IMDA опубликовал первую в мире Model AI Governance Framework for Agentic AI в Давосе 22 января 2026 года. MAS опубликовал свой AI Risk Management Toolkit в марте 2026 года в рамках Project MindForge, разработанный с 24 финансовыми организациями. Система охватывает сферу действия и надзор за ИИ, управление рисками ИИ, управление жизненным циклом ИИ и организационные факторы. Предложенные MAS формальные Guidelines on AI Risk Management ожидаются к финализации в 2026 году, переходя от добровольных принципов FEAT к надзорным ожиданиям с последствиями для комплаенса. Австралийский ASIC выпустил открытое письмо в мае 2026 года, требующее усиления киберзащиты в ответ на угрозы передового ИИ.

FSB (Глобально, межюрисдикционно). Консультация FSB от июня 2026 года — первая глобальная система, трактующая агентный ИИ как операционно отличный, — определяет шесть моделей надзора для агентных систем и рекомендует «человека-в-управлении» для процессов высокой автономности, мониторинг «ИИ-в-контуре» по мере роста популяций агентов и одобрение человеком или двойную авторизацию для агентов, исполняющих финансовые транзакции сверх пороговых сумм. Приём комментариев закрывается 22 июля 2026 года; итоговый отчёт министрам финансов G20 в октябре 2026 года.

Уровень зрелости	Как это выглядит	Индексная оценка
Уровень 1 — Инвентаризация юрисдикций	Применимые системы выявлены по юрисдикциям; нет сопоставления уровня процесса; «комплаенс по аналогии» с до-ИИ системами	0–24
Уровень 2 — Сопоставление с системами	Каждый продуктивный агентный процесс сопоставлен с применимыми системами; пробелы выявлены; составлены планы устранения	25–49
Уровень 3 — Доказанное соответствие	Пакеты доказательств по каждому процессу произведены относительно применимых систем; логирование по каждому агенту согласно Статье 12 EU AI Act завершено; Рекомендуемые практики FSB 5–10 сопоставлены с внутренними средствами контроля; четырёхмерное сопоставление Singapore MGF завершено	50–74
Уровень 4 — Проактивное регуляторное взаимодействие	Организация участвует в консультациях FSB, IOSCO и национальных регуляторов; регуляторная разведка интегрирована в жизненный цикл развёртывания агентов; надзорные доказательства генерируются автоматически операционными конвейерами, а не собираются постфактум	75–100

Сводная индексная оценка

Шесть оценок по измерениям объединяются в сводный индекс с использованием следующих весов по регуляторной существенности:

Измерение	Вес	Обоснование
Архитектура управления	25%	Наибольший вес: плоскость управления — единственное, что отказывает безопасно при отказе модели
Полнота регуляторных доказательств	20%	Жизненно важна для срока EU AI Act 2 августа и непрерывной надзорной готовности
Охват уровней автономности	15%	Слегка снижен с учётом того, что классификация уровней, будучи фундаментальной, теперь является пороговым ожиданием, а не дифференциатором
Экономическая подотчётность	15%	Критична для соответствия CFO/ROI сценариям McKinsey по пулам прибыли и разрыву ROTE
Организационная готовность	10%	Упрощена: структурное управление необходимо, но всё более является базовым требованием в организациях первого эшелона
Глобальное регуляторное соответствие	15%	Повышен: должен активно учитывать риск концентрации сторонних ICT по DORA, трансграничное исполнение агентов и оценку риска системной стадности

Сводная оценка ниже 50 означает, что организация не может защитить свою текущую позицию по агентному ИИ перед проверяющим по SR 11-7, выездной проверкой PRA или надзорной оценкой EU AI Act. Оценка 50–74 означает, что средства контроля существуют, но ещё не непрерывны и не готовы к доказательству. Оценка 75–100 означает, что управление — конкурентный актив, а не издержка комплаенса.

Текущие сигналы для отслеживания

Сигнал	Что это значит для банков	Источник
52% внедрения агентного ИИ	Управление просрочено; организации на стадиях масштабирования или трансформации нуждаются в плоскости управления, а не в очередном пилоте	Cambridge CCAF
66,3% успешности задач OSWorld	Один из трёх отказов на структурированном использовании инструментов; неконтролируемое исполнение в API клиентских средств неприемлемо	Stanford HAI
31% новых банковских сценариев ИИ — агентные	Самая быстрорастущая категория в I квартале 2026 года; инфраструктура управления всё больше отстаёт от развёртывания	Evident Insights
Рекомендуемые практики FSB от июня 2026 года	Первая глобальная система, трактующая агентный ИИ как операционно отличный; пока необязательна, результат для G20 в октябре 2026 года	FSB
Срок EU AI Act 2 августа 2026 года	Полные обязательства Приложения III в силе; надзорные проверки Германии, Франции, Нидерландов подтверждены на III квартал 2026 года	EU AI Office
Долгоработающие агенты JP Morgan: 2026	Развёртывание автономных агентов на 1–2 часа в том же году меняет конкурентный бенчмарк для каждого G-SIB и регионального банка	CNBC
IBM: 1661 агент к 2027 году	Разрастание корпоративных агентов — вызов управления 2027 года, если не решён в 2026 году; лишь 11% заявляют о готовности	IBM
Singapore MGF по агентному ИИ: январь 2026 года	Первая в мире система управления, специфичная для агентного ИИ; четыре понятия (иерархия принципала, граница задачи, минимальный след, объяснимость) применимы универсально	IMDA
IOSCO Supervisory Toolkit: май 2026 года	Полный охват жизненного цикла ИИ, включая агентный ИИ; риски эмерджентного поведения и каскадных отказов названы прямо	IOSCO
McKinsey: разрыв 4 п.п. ROTE	Пионеры ИИ могут открыть преимущество в 4 процентных пункта ROTE над отстающими; инфраструктура измерения для захвата этого разрыва — юнит-экономика уровня процесса	McKinsey

Что это значит по типам организаций

Глобальные системно значимые банки (G-SIB)

G-SIB сталкиваются с самым тяжёлым вызовом управления — не потому что технология сложнее, а потому что масштаб и юрисдикция умножают каждый пробел. G-SIB с 200 продуктивными агентами в 30 бизнес-линиях в 15 регуляторных юрисдикциях имеет 200 потенциальных замечаний по SR 11-7, 200 потенциальных сбоев журнала аудита EU AI Act и 200 потенциальных пробелов по Рекомендуемым практикам FSB — одновременно. Приоритет инвестиций — не очередной пилот. Это центральная плоскость управления, унифицированная инфраструктура журнала аудита и стенд MRM, способный валидировать 50+ агентов в квартал.

Объявление JP Morgan о долгоработающих автономных агентах в 2026 году — плоскости управления агентами DBS в подготовке кредитных меморандумов и обслуживании клиентов — BNP Paribas, достигший своих целей по ИИ на 2025 год и начавший ежеквартальную отчётность по ROI, — это конкурентные ориентиры, относительно которых должен сверяться каждый совет директоров G-SIB. Институциональный вопрос не в том, развёртывать ли; он в том, способна ли плоскость управления масштабироваться теми же темпами, что и популяция агентов.

FSB прямо предупреждает о риске концентрации из-за зависимости от нескольких провайдеров облака, аппаратного обеспечения и базовых моделей — и отмечает, что общие модели и данные могут подтолкнуть организации к коррелированному поведению, усиливающему стадность и процикличность в спаде. G-SIB, получающие 80% своей агентной инфраструктуры от двух вендоров базовых моделей, строят системную корреляцию, которую им придётся объяснять как собственным риск-командам, так и своим надзорным органам.

Системная стадность и процикличность: архитектурный риск, который не решить ни одному банку в одиночку. Трекер сценариев Evident Insights за I квартал 2026 года выявляет, что 68% агентных развёртываний банков теперь используют длинный хвост специализированных вендоров — большинство из которых построены на идентичных базовых передовых моделях, преимущественно Claude от Anthropic. Это создаёт структурную уязвимость к стадности, существенно отличающуюся от рисков концентрации, которыми банки уже управляют в облачной инфраструктуре или платёжных рельсах.

Механизм таков. Торговый агент банка, агент ликвидности и агент ужесточения кредита построены на разных вендорских платформах. У них разные системные промпты, разные схемы вызова инструментов, разные политические шлюзы OPA. Но они разделяют идентичную базовую модель — те же веса, то же распределение обучения, те же эмерджентные поведенческие паттерны под распределительным стрессом. Когда происходит значимое рыночное событие — суверенный кредитный дефолт, коммуникация ФРС, отличная от консенсуса, крах крупного банка, — каждый агент, построенный на той же базовой модели, обработает событие через те же неявные веса признаков. Если эти веса дают направленное смещение к поведению ухода от риска, торговые, ликвидностные и кредитные агенты нескольких банков могут одновременно исполнить коррелированные распродажи, циклы ужесточения кредита или изъятия ликвидности — не потому, что агент какого-либо отдельного банка неисправен, а потому, что все они корректно функционируют поверх одной модели.

IOSCO прямо назвал эту динамику в Supervisory Toolkit от мая 2026 года, предупредив, что способности к планированию, долгосрочная память и доступ к внешним инструментам создают риски эмерджентного поведения и каскадных отказов во взаимосвязанных системах. Консультация FSB от июня 2026 года прямо адресует процикличность, отмечая, что если ИИ-агенты обучены на одних и тех же данных и используют схожие модели, их поведение, вероятно, будет коррелированным, потенциально усиливая рыночные движения.

Оценка устойчивости к системной стадности в Измерении 6 требует трёх раскрытий и одного архитектурного средства контроля. Раскрытия: какова базовая модель для каждого продуктивного агентного процесса; какова карта зависимостей от вендоров по портфелю агентов; и какова оценка организацией своего вклада в межинституциональное коррелированное поведение при определённом стресс-сценарии. Архитектурное средство контроля: по крайней мере один из основных агентов в классах активов высокого риска (трейдинг, управление ликвидностью, кредит) должен использовать иную базовую модель или существенно иной донастроенный вариант, чтобы распределительный отклик одной модели на стресс-событие не мог дать полностью коррелированный результат по всем агентным процессам одновременно. Это разнообразие моделей как управление системным риском — агентный эквивалент диверсификации контрагентов.

Транзакционные и корпоративные банки

Агентные процессы с наивысшим ROI — ремонт платежей, извлечение KYC-документов, казначейские услуги, расхождения при сверке и обработка типовых вопросов корпоративных клиентов. Все уровня 2 или ограниченного уровня 3 по лестнице автономности. Корпоративному клиенту неважно, что платёж починил агент; ему важно, что SLA улучшился, а доля споров осталась плоской. Начинайте с четырёх юнит-экономических метрик, а не с заявлений о технологических возможностях.

Система автономного казначейства — наблюдать → обнаружить → прогнозировать → подготовить → запросить одобрение человека → отправить подписанную полезную нагрузку — это правильная архитектура для агентов корпоративного казначейства в 2026 году. Подготовленная агентом полезная нагрузка pain.001 проходит через те же валидацию схемы, скоринг мошенничества и санкционные движки, что и подача из корпоративной ERP. Слой условности (порог, приемлемость залога, минимальный буфер) определяет, отправляется ли pain.001, а не то, какую форму он принимает. Казначейские платформы, изобретающие нестандартные полезные нагрузки для выражения условий, выпадут из банк-потребляемого пути.

Региональные и местные банки

Сценарный анализ McKinsey выделяет три жизнеспособные позиции: выжидать, адаптироваться как поставщик продуктов за агентными интерфейсами или конкурировать за прямые отношения с клиентом. Региональные банки, не сделавшие этот выбор явно, по умолчанию дрейфуют в выжидательную позицию — и обнаруживают, что управленческий долг, накопленный за время этого дрейфа, становится главным препятствием, когда конкурентное давление вынуждает к действию.

Принцип пропорциональности OCC — «пропорциональное не означает отсутствующее» — это операционная рамка для регионального управления. Региональному банку не нужно валидировать 50 агентов в квартал. Ему нужен один офицер по модельному риску, понимающий лестницу автономности, одна реализация вендорской агентной платформы, поставляемая с ограничением прав через OAuth, интеграцией OPA и журналированием аудита WORM «из коробки», и один шаблон отчётности совету, охватывающий четыре юнит-экономические метрики. Инвестиции — в проектирование процессов и UX оператора, а не в нестандартную инженерию плоскости управления.

Опрос CSI Banking Priorities 2026 года показал, что 85% респондентов из местных банков считают, что внедрение ИИ обеспечит значимое конкурентное преимущество, а 50% назвали его главным технологическим трендом 2026 года. Инфраструктура управления — это то, что отделяет 85% верящих от малой доли тех, кто захватит ценность.

Финтехи, PSP и провайдеры инфраструктуры

Продуктовый вопрос для вендоров агентного ИИ в 2026 году не «работает ли ваша платформа лучше людей?» Он звучит так: «производит ли ваша платформа аудиторский след, соответствующий SR 11-7, журнал по каждому агенту, соответствующий Статье 12 EU AI Act, и модель надзора, соответствующую Рекомендуемой практике FSB 10, — из коробки?» Вендоры, способные ответить на это документированным, проверяемым «да», будут закрывать корпоративные сделки. Вендоры, которые не могут, будут крутиться в циклах пилотов, пока банковские команды MRM находят причины провалить валидацию.

Oracle запустил корпоративную платформу агентного ИИ для банков в феврале 2026 года. FIS вступил в партнёрство с Mastercard и Visa для обеспечения коммерции, инициируемой агентами. Microsoft опубликовал банк-специфичный чертёж агентного клиентского опыта. Accenture обрисовал последствия для рабочей силы во фронт- и бэк-офисе. Сторона предложения готова. Дифференциация — в регуляторных доказательствах как продуктовой характеристике, а не в постфактум-довеске комплаенса.

Динамика длинного хвоста вендоров, выявленная Evident, — 68% агентных развёртываний в банках теперь используют специализированных вендоров вне гиперскейлеров, — означает, что риск сторонних ИИ-вендоров ускоряется быстрее, чем большинство банковских закупочных систем способны его оценить. DORA требует документированной должной осмотрительности по каждому стороннему ICT-провайдеру. EU AI Act добавляет дополнительные требования для вендоров, чьи системы используются в категориях высокого риска. Банки, передающие управление на аутсорсинг своему вендору, передают на аутсорсинг подотчётность — и надзорная запись это отразит.

Корпорации и предприятия МСБ (небанковские финансовые услуги)

Бремя управления пропорционально существенности риска использования агентного ИИ, но измерительная система применима универсально. Предприятию, развёртывающему агентов в кредиторской задолженности, оптимизации оборотного капитала или финансовом планировании и анализе, нужна та же система юнит-экономической подотчётности — стоимость одного завершённого решения, доля откатов, полнота аудиторского следа, — даже если регуляторные обязательства легче, чем у системно значимого банка. Рекомендуемые практики FSB сформулированы как необязательное руководство, применимое к финансовым организациям всех типов и размеров. Вывод IBM о том, что предприятия в среднем имеют 54 инцидента с ИИ-агентами в год, включая утечки данных и каскадные сбои систем, применим по всему корпоративному ландшафту.

Для МСБ, получающих доступ к банковским услугам через агентные интерфейсы, — сценарий, который McKinsey описывает как использование потребителями ИИ-агентов в качестве нового банковского канала, — обязательство управления ложится выше по цепочке на банк или PSP, предоставляющий агентный слой. Но собственная сохранность данных и операционная целостность МСБ зависит от реальности этого управления. Понимание индексной оценки организаций, управляющих вашими финансовыми процессами, стремительно становится критерием выбора вендора.

Оценочная карта уровня совета директоров

Полезная оценочная карта для совета директоров по агентному ИИ должна отслеживать шесть метрик — минимальный набор, отличающий управляемую программу от неуправляемой:

Распределение по уровням автономности: Число продуктивных процессов по уровням (уровни 0–4), обновляемое ежеквартально. Любой процесс уровня 5 — это подлежащее отчёту замечание.
Полнота плоскости управления: Процент продуктивных процессов со всеми пятью действующими компонентами плоскости управления (идентичность, защитные ограничения, политика как код, журналирование WORM, аварийный выключатель).
Полнота аудиторского следа: Процент вызовов процессов уровня 3+ с полным происхождением, реконструируемым из неизменяемого журнала. Цель: 100%.
Доля откатов по процессам: Процент исполненных агентом действий, отменённых в течение 24 часов, отслеживаемый по каждому процессу. Порог оповещения: 2%. Порог эскалации: 5%.
Чистая стоимость одного решения: Удельная стоимость уровня процесса, включающая стоимость отката и исправления, в сравнении с ручным базисом. Отслеживается относительно экономического обоснования программы.
Актуальность регуляторных доказательств: Дата самого свежего обновления регуляторных доказательств по каждому процессу в применимых системах (SR 11-7, SS1/23, EU AI Act, MAS MGF). Любой процесс с просрочкой более 90 дней относительно ритма доказательств — это рисковое замечание.

Эти шесть чисел превращают агентный ИИ из презентации в операционную модель. Это также те числа, которые проверяющий по SR 11-7, выездной ревизор PRA или европейский надзорный орган запросят в первую очередь.

Пробелы, которые закрывает этот индекс

Три структурных пробела отличают этот индекс от существующих систем:

Пробел 1: Существующие индексы измеряют зрелость ИИ, а не управление, специфичное для агентного ИИ. Индекс Evident AI измеряет талант, инновации, лидерство и прозрачность по 50 банкам, используя общедоступные данные. Он не оценивает — и не предназначен для этого, — имеют ли продуктивные агентные процессы банка действующие аварийные выключатели, журналы аудита WORM по каждому агенту или политические шлюзы OPA. Банк может занять первое место в индексе Evident, провалив при этом аудит по Статье 12 EU AI Act.

Пробел 2: Существующие регуляторные системы адресуют то, что требуется, а не то, как оценивать готовность. SR 11-7, SS1/23, EU AI Act, Рекомендуемые практики FSB и Singapore MGF — каждая определяет обязательства управления. Ни одна не предоставляет межизмеренческой системы оценки, позволяющей организации сравнить свою позицию с конкурентами или измерить улучшение во времени. Этот индекс предоставляет такую систему оценки, используя существующие регуляторные системы как доказательную базу.

Пробел 3: Экономика уровня программы маскирует отказы уровня процесса. Отраслевой стандарт отчётности о ценности ИИ на уровне программы — «ИИ сэкономил X часов комплаенс-работы» — делает структурно невозможным проследить откат, ложноположительный отчёт SAR или необъяснённое действие агента до процесса, который его породил. Юнит-экономическое измерение этого индекса требует подотчётности на уровне процесса. Это та измерительная архитектура, которая делает разговор с финансовым директором защитимым, а аудиторский разговор — переживаемым.

Заключение

Агентный ИИ в банках в 2026 году — это инженерная проблема в одеждах стратегического разговора. Модель взаимозаменяема. Плоскость управления — ограничение прав через OAuth, детерминированная семантическая маршрутизация, политические шлюзы OPA, неизменяемые журналы аудита WORM и протестированный аварийный выключатель — нет. Архитектура управления — валидация по трём линиям защиты, непрерывные банк-специфичные наборы оценок, отчётность по юнит-экономике уровня совета директоров — нет. Пакет регуляторных доказательств — карточки моделей SR 11-7 по каждому процессу, журналы по каждому агенту согласно Статье 12 EU AI Act, сопоставления с Рекомендуемыми практиками FSB — нет.

Организации, которые будут вызывать доверие у регуляторов в 2027 году, — это те, кто сегодня набирает выше 75 по всем шести измерениям индекса: классифицирует каждого продуктивного агента на лестнице автономности, проектирует полную пятикомпонентную плоскость управления, производит непрерывные регуляторные доказательства, отслеживает юнит-экономику уровня процесса, инвестирует в организационную готовность и проактивно участвует в консультациях FSB, IOSCO и национальных регуляторов, формирующих обязательные стандарты 2028 года.

OSWorld на уровне 66,3% — это потолок надёжности. Три связанных вызова инструмента при такой надёжности дают 29% сквозной успешности. Планируйте соответственно. Организации, измеряющие агентов так же, как любой другой операционный риск — доказательствами, а не устремлениями, — обнаружат, что управление не является ограничением для агентного ИИ. Это единственное, что делает агентный ИИ конкурентоспособным.

Часто задаваемые вопросы

В чём разница между этим индексом и индексом Evident AI? Индекс Evident AI сравнивает зрелость ИИ по 50 глобальным банкам, используя общедоступные данные по таланту, инновациям, лидерству и прозрачности. Этот индекс оценивает конкретную инженерную и управленческую архитектуру — плоскость управления, журнал аудита, классификацию уровней автономности, пакет регуляторных доказательств, — которая делает агентный ИИ безопасным для развёртывания в действующих банковских API. Два индекса дополняют друг друга: Evident измеряет стратегическую позицию; этот индекс измеряет операционную готовность.

Кому следует использовать этот индекс? Операционным директорам, директорам по рискам, директорам по ИИ, руководителям управления модельным риском и риск-комитетам советов директоров в глобальных банках, региональных банках, корпоративных банковских структурах и финансовых организациях, развёртывающих агентный ИИ. Также актуален для финтехов, PSP и вендоров инфраструктуры, продающих в банковские закупочные процессы, где регуляторные доказательства являются критерием выбора.

Какова минимально жизнеспособная позиция управления для 2026 года? Полная пятикомпонентная плоскость управления действует в продуктиве; все продуктивные процессы классифицированы уровнями 0–4; процессы уровня 5 запрещены договором; журналы аудита WORM полны для процессов уровня 3+; логирование по каждому агенту согласно Статье 12 EU AI Act налажено до 2 августа 2026 года; Рекомендуемые практики FSB 1–4 сопоставлены со структурами подотчётности совета директоров; банк-специфичный набор оценок работает непрерывно.

Что объявление JP Morgan значит для моей организации? Оно означает, что конкурентный бенчмарк развёртывания автономных агентов получил названный график на 2026 год от системно значимого банка. Это не означает, что каждой организации следует соответствовать этому графику. Это означает, что каждой организации следует знать свою текущую индексную оценку, знать разрыв между этой оценкой и позицией развёртывания, которую описывает JP Morgan, и иметь одобренное советом директоров видение инвестиций в управление, требуемых для безопасного закрытия этого разрыва.

Как следует отчитываться о риске агентного ИИ перед советом директоров? Шесть метрик по каждому процессу: уровень автономности, полнота плоскости управления, полнота аудиторского следа, доля откатов, чистая стоимость одного решения и актуальность регуляторных доказательств. Плюс топ-5 остаточных рисков. Пропустите слайды с карточками моделей и сводки производительности уровня программы.

Создаёт ли консультация FSB обязательные обязательства уже сейчас? Нет. FSB прямо заявляет, что 12 Рекомендуемых практик не являются обязательными стандартами. Однако консультация закрывается 22 июля 2026 года, и итоговый отчёт направляется министрам финансов G20 в октябре 2026 года. Национальные регуляторы — ФРС, PRA, BaFin, DNB, ACPR, MAS — вправе включить Рекомендуемые практики в обязательные надзорные ожидания по собственным графикам. Организации, отвечающие на консультацию сейчас, — это те, кто формирует то, как будет выглядеть обязательное.

Источники

Последняя проверка 2026-06-30.

Последняя проверка 2026-06-29.

Опубликовать заново

Индекс agentic AI для банков в 2026 году: измерение автономии — Sebastien Rousseau

Шестимерный индекс готовности банков к agentic AI: уровни автономии, governance, регуляторные доказательства, экономика, готовность и глобальное соответствие.

Эта статья распространяется по лицензии Creative Commons Attribution 4.0 International. При повторной публикации требуется указание канонической ссылки.

Индекс agentic AI для банков в 2026 году: измерение автономии — Sebastien Rousseau

Шестимерный индекс готовности банков к agentic AI: уровни автономии, governance, регуляторные доказательства, экономика, готовность и глобальное соответствие.

Originally published at https://sebastienrousseau.com/ru/2026-06-30-agentic-ai-index-banks-measuring-autonomy-2026/ by Sebastien Rousseau.
Licensed under CC-BY-4.0.

SEBASTIEN ROUSSEAU FOUNDER · ENGINEER