Схема работы агента

Разделение ответственности

Платформа предоставляет технологии из каталога — мы разворачиваем у себя и наполняем данными. Модели разворачивает платформа — мы через API.
Платформа — инфраструктура
  • Compute: кластер, GPU, сети, балансировка
  • Каталог инструментов: предоставляет технологии для развёртывания
  • Апробация: запрос → согласование → продуктив
Платформа — модели как сервис
  • Инференс: платформа разворачивает LLM и модели векторизации
  • API: единая точка входа, мы потребляем через API
  • Мониторинг: метрики, дашборды, оповещения
Мы — данные + алгоритмы
  • Данные: эмбеддинги, графы, индексы, сессии, правила
  • Алгоритмы: агентные сценарии, RAG, промпты, валидация
  • Инстансы из каталога: память, знания, интеграции, трассировка
Мы — специфические модели (вопрос)
  • Дообучение: доменные модели (L2-уровень)
  • Инфраструктура: GPU для обучения, эксперименты
  • Интеграция: модель → платформенный сервис → тот же API

Процесс работы агента

🤖 Агент
вход
📥
Задача + контекст
① Получение задачи
ИТ-системы (существующие), интеграционные механизмы (существующие и новые), чаты и помощники (новые)
→ общая схема: транспорт и интеграция
существующие: ERP, MES, WMS → события
существующие + новые: ESB, Kafka, MCP, n8n
новые: Chat UI, Copilot, TrueConf
сборка контекста
📋
Сборка контекста
② Сборка контекста
Краткосрочная память (сессия), долгосрочная память (знания, прошлый опыт), промпты и конфигурация агента, корпоративные данные
→ общая схема: память + знания
существующее: Redis — краткосрочная память (сессия)
ИИ БЛПС
pgvector, OpenSearch — векторный и полнотекстовый поиск
Neo4j — граф знаний и связей
Промпты, примеры решений, схемы инструментов
Дата-платформа / каталог данных
PostgreSQL, Arenadata — хранилища
Informatica Catalog, Плюс7 EDM — каталог
Informatica MDM, КСУ НСИ — мастер-данные
план
🗺️
План (один раз)
③ Планирование
Декомпозиция задачи на шаги на основе ограничений, похожих кейсов и графа зависимостей. Один раз до цикла.
Платформа ИИ
Вызов LLM через API — декомпозиция задачи
ИИ БЛПС
Граф знаний (Neo4j) — зависимости и ограничения
Векторное хранилище (pgvector) — похожие кейсы
Переранжирование, валидатор допустимых действий
ядро
⚙️ Цикл рассуждений (Размышление → Действие → Наблюдение)
💭
Размышление
Действие
👁️
Наблюдение
↩ цикл повторяется на каждой итерации, пока агент не решит что готов ответить
🚦 Политики (до вызова) OPA+Rego на каждом вызове инструмента. Разрешить / запретить / запросить согласование.
🛡️ Ограничения (после вызова) Проверка схемы Pydantic + повтор/откат на каждой итерации.
🔀 LLM-роутер (LiteLLM) Разные модели для разных шагов.
④ Цикл рассуждений (ReAct)
Размышление: LLM решает следующий шаг. Действие: вызов инструмента (проверка политик до вызова). Наблюдение: валидация результата, ревизия плана.
→ общая схема: граф выполнения
Платформа ИИ
Вызов LLM через API — рассуждение, вызов функций
Роутинг между моделями (лёгкая / сильная)
ИИ БЛПС
Граф выполнения (LangGraph) — состояние, ветвления
Движок политик (OPA) — Rego-правила до/после вызова
Валидатор (Pydantic) · очереди задач (Celery/Temporal)
инструменты
🔍
RAG-поиск
🔌
API систем
🧮
Солвер
💻
Код / SQL
👥
Др. агент через орк.
🌐
Веб опц.
🗂️ Tool Registry — allowlist с JSON-схемами (bounded execution)
⑤ Вызов инструментов
RAG-поиск: embedding → pgvector/OpenSearch → Neo4j → reranker → промпт. API систем через ESB/MCP. Солвер для оптимизации.
→ общая схема: извлечение знаний
Платформа ИИ
Вызов модели векторизации через API
ИИ БЛПС
Векторный поиск (pgvector) · полнотекстовый (OpenSearch)
Граф знаний (Neo4j) · переранжирование (FlagEmbedding)
существующее: ESB, Kafka, MCP — транспорт к целевым системам
финал
Финальная валидация
👤
Согласование человеком по требованию
⑥ Валидация и согласование
Проверка схемы ответа, итоговая проверка политик. При необходимости — пауза для согласования человеком, ресурсы свободны.
→ общая схема: политики
ИИ БЛПС
Валидатор ответа (Pydantic) — проверка схемы
Движок политик (OPA) — итоговая проверка правил
Хранение состояния (Redis/Temporal) — для пауз согласования
выход
📤
Ответ
📊
Observability
⑦ Ответ + трассировка
Структурированный результат отдаётся вызывающему. Каждый шаг логируется. Метрики инфраструктуры и качества.
→ общая схема: наблюдаемость
Платформа ИИ
Мониторинг — метрики инфраструктуры, дашборды, оповещения
ИИ БЛПС
Трассировка LLM (Langfuse) — все шаги агента
Оценка качества RAG (RAGAS) — метрики точности
Доставка результата через шину событий