Разделение ответственности
Платформа предоставляет технологии из каталога — мы разворачиваем у себя и наполняем данными. Модели разворачивает платформа — мы через API.
Платформа — инфраструктура
- Compute: кластер, GPU, сети, балансировка
- Каталог инструментов: предоставляет технологии для развёртывания
- Апробация: запрос → согласование → продуктив
Платформа — модели как сервис
- Инференс: платформа разворачивает LLM и модели векторизации
- API: единая точка входа, мы потребляем через API
- Мониторинг: метрики, дашборды, оповещения
Мы — данные + алгоритмы
- Данные: эмбеддинги, графы, индексы, сессии, правила
- Алгоритмы: агентные сценарии, RAG, промпты, валидация
- Инстансы из каталога: память, знания, интеграции, трассировка
Мы — специфические модели (вопрос)
- Дообучение: доменные модели (L2-уровень)
- Инфраструктура: GPU для обучения, эксперименты
- Интеграция: модель → платформенный сервис → тот же API
Процесс работы агента
🤖 Агент
① Получение задачи
ИТ-системы (существующие), интеграционные механизмы (существующие и новые), чаты и помощники (новые)
существующие: ERP, MES, WMS → события
существующие + новые: ESB, Kafka, MCP, n8n
новые: Chat UI, Copilot, TrueConf
② Сборка контекста
Краткосрочная память (сессия), долгосрочная память (знания, прошлый опыт), промпты и конфигурация агента, корпоративные данные
существующее: Redis — краткосрочная память (сессия)
ИИ БЛПС
pgvector, OpenSearch — векторный и полнотекстовый поиск
Neo4j — граф знаний и связей
Промпты, примеры решений, схемы инструментов
Дата-платформа / каталог данных
PostgreSQL, Arenadata — хранилища
Informatica Catalog, Плюс7 EDM — каталог
Informatica MDM, КСУ НСИ — мастер-данные
③ Планирование
Декомпозиция задачи на шаги на основе ограничений, похожих кейсов и графа зависимостей. Один раз до цикла.
Платформа ИИ
Вызов LLM через API — декомпозиция задачи
ИИ БЛПС
Граф знаний (Neo4j) — зависимости и ограничения
Векторное хранилище (pgvector) — похожие кейсы
Переранжирование, валидатор допустимых действий
ядро
⚙️ Цикл рассуждений (Размышление → Действие → Наблюдение)
↩ цикл повторяется на каждой итерации, пока агент не решит что готов ответить
🚦 Политики (до вызова)
OPA+Rego на каждом вызове инструмента. Разрешить / запретить / запросить согласование.
🛡️ Ограничения (после вызова)
Проверка схемы Pydantic + повтор/откат на каждой итерации.
🔀 LLM-роутер (LiteLLM)
Разные модели для разных шагов.
④ Цикл рассуждений (ReAct)
Размышление: LLM решает следующий шаг.
Действие: вызов инструмента (проверка политик до вызова).
Наблюдение: валидация результата, ревизия плана.
Платформа ИИ
Вызов LLM через API — рассуждение, вызов функций
Роутинг между моделями (лёгкая / сильная)
ИИ БЛПС
Граф выполнения (LangGraph) — состояние, ветвления
Движок политик (OPA) — Rego-правила до/после вызова
Валидатор (Pydantic) · очереди задач (Celery/Temporal)
инструменты
🗂️ Tool Registry — allowlist с JSON-схемами (bounded execution)
⑤ Вызов инструментов
RAG-поиск: embedding → pgvector/OpenSearch → Neo4j → reranker → промпт. API систем через ESB/MCP. Солвер для оптимизации.
Платформа ИИ
Вызов модели векторизации через API
ИИ БЛПС
Векторный поиск (pgvector) · полнотекстовый (OpenSearch)
Граф знаний (Neo4j) · переранжирование (FlagEmbedding)
существующее: ESB, Kafka, MCP — транспорт к целевым системам
финал
👤
Согласование человеком по требованию
⑥ Валидация и согласование
Проверка схемы ответа, итоговая проверка политик. При необходимости — пауза для согласования человеком, ресурсы свободны.
ИИ БЛПС
Валидатор ответа (Pydantic) — проверка схемы
Движок политик (OPA) — итоговая проверка правил
Хранение состояния (Redis/Temporal) — для пауз согласования
⑦ Ответ + трассировка
Структурированный результат отдаётся вызывающему. Каждый шаг логируется. Метрики инфраструктуры и качества.
Платформа ИИ
Мониторинг — метрики инфраструктуры, дашборды, оповещения
ИИ БЛПС
Трассировка LLM (Langfuse) — все шаги агента
Оценка качества RAG (RAGAS) — метрики точности
Доставка результата через шину событий