Открытые проекты, близкие к нашей мультиагентной архитектуре
Публичные репозитории на GitHub, которые целиком или частично реализуют слои нашей референсной схемы: оркестрация агентов, RAG+knowledge, policy/guardrails, observability. Звёзды и форки — снимок на дату сборки страницы.
Ни один публичный проект не повторяет нашу схему 1:1 (особенно связку OPA+Rego + MLflow registry + Temporal + RAG + HiL), но каждый блок архитектуры имеет зрелого OSS-представителя. Зелёный тег близко — репозиторий реализует тот же класс задач, что соответствующий слой. Оранжевый альтернатива — концептуально похожее решение, но на другом стеке.
Соответствие нашей референсной архитектуре Анализ покрытия
Сравнение топ-6 кандидатов по 16 блокам нашей схемы. Ни один проект не покрывает всё — это карта, что закрыто из коробки, а что придётся собирать вокруг выбранной базы.
● есть как первый класс◐ частично / сбоку○ нет
Блок архитектуры
open_deep_research
LangGraph
CrewAI
OpenHands
AutoGen
MetaGPT
Граф-оркестратор
●
●
◐
●
◐
◐
Планировщик как узел
●
◐
●
●
◐
●
Short-term state / checkpointer
●
●
◐
●
◐
◐
Long-term memory / RAG
●
○
◐
◐
○
◐
Tools + function calling
●
●
●
●
●
●
MCP-протокол
●
●
◐
●
◐
○
Tool binding (bounded)
◐
◐
◐
●
◐
◐
Policy Engine (OPA / Rego)
○
○
○
○
○
○
Content safety (NeMo)
○
○
○
◐
◐
○
Schema validation (Pydantic)
●
●
●
◐
●
◐
HiL interrupt / resume
●
●
◐
●
◐
○
Durable execution (Temporal)
○
○
○
○
○
○
Model registry (LiteLLM / MLflow)
◐
◐
●
●
◐
◐
LLM tracing (Langfuse / OTel)
●
●
●
●
●
◐
RAG eval (RAGAS)
○
○
○
○
○
○
Мультиагентность
◐
◐
●
◐
●
●
Итоговая оценка
8.5 / 10
8.5 / 10
6.5 / 10
5.5 / 10
5.0 / 10
3.5 / 10
Ключевые наблюдения. LangGraph и open_deep_research ближе всего к центру нашей схемы — они закрывают ядро оркестратора и HiL. CrewAI силён в ролевой декомпозиции (Layer 4), но слабее в durable state. OpenHands — самый production-grade, но заточен под агента-разработчика и не про операционные системы ERP/MES. MetaGPT и AutoGen — скорее research-tools, чем основа для enterprise-кейса.
Что не покрывает НИ ОДИН проект: Policy Engine (OPA+Rego), Durable Execution (Temporal), RAG eval (RAGAS), Ontology/Data catalog, интеграция через ESB/MCP как транспорт. Это дыры, которые придётся закрывать руками независимо от выбора базы.
Рекомендации что взять, добавить, убрать
✓ Взять как базу
LangGraph — ядро оркестратора, interrupt/resume для HiL из коробки
open_deep_research — готовый LangGraph-шаблон с RAG и HiL, стартовая точка для адаптации под домен
OpenHands — сильная инженерия (sandbox, bounded tools), но домен «агент-разработчик», не ERP/MES. Оставить как референс решений, не как базу
AutoGen — GroupChat слабее LangGraph-state-graph для stateful-кейсов с HiL
Скоринг и план дошивки усилие на закрытие дыр из нашего стека
Итоговая оценка по формуле: покрытие таблицы (●=2, ◐=1, ○=0, макс 32) · усилие на добавление недостающего из нашего стека (low/med/high) · архитектурный fit (совпадение парадигмы с нашей графово-stateful схемой). Для каждого — конкретно, что и как прикрутить.
LangGraph
8.5 / 10
покрытие 56%усилие: среднеfit ⭐⭐⭐
Что дошить из нашего стека:
RAG / long-term memory — подключить pgvector + BGE-M3 как retriever node в граф. Усилие: low, это штатный pattern LangChain.
Policy / OPA — обернуть каждый tool call middleware-декоратором, который дёргает OPA sidecar (/v1/data/tools/allow). Усилие: medium, надо написать decorator и политики на Rego.
Durable execution — для долгих HiL-пауз обернуть граф в Temporal workflow, каждый узел = activity. Усилие: medium-high, требует переосмысления state-персистенции (LangGraph checkpointer ↔ Temporal history).
Content safety — NeMo Guardrails как pre-/post-processor на узлах LLM-вызова. Усилие: low.
Model registry — LiteLLM как единая точка входа для всех LLM узлов + MLflow для регистрации промпт-версий. Усилие: low.
Вердикт: базовый кандидат. Ядро уже совпадает с нашей схемой, дошивка — инженерная работа без концептуальных компромиссов.
open_deep_research
8.5 / 10
покрытие 66%усилие: низкоеfit ⭐⭐⭐
Что дошить из нашего стека:
Policy / OPA — тот же OPA middleware, что и у LangGraph (это LangGraph-приложение). Усилие: medium.
Durable execution — Temporal-обёртка вокруг верхнеуровневого графа. Усилие: medium.
Domain retrievers — заменить встроенный web-search retriever на pgvector/Qdrant с доменными корпусами + подключить ESB/MCP как источник операционных данных. Усилие: low.
Durable execution — нет интеграции с Temporal, придётся писать свою. Усилие: high.
Вердикт: хорош для Layer 4 (ролевая декомпозиция команды агентов), но как база всей оркестрации уступает LangGraph из-за слабого state management и HiL. Рассматривать как дополнение, не замену.
OpenHands
5.5 / 10
покрытие 69%усилие: высокоеfit ⭐
Что дошить из нашего стека:
Переориентация домена — OpenHands заточен под агента-разработчика (file ops, code execution, git). Для ERP/MES-кейсов придётся переписать большую часть action space. Усилие: very high.
Policy / OPA + durable + RAG eval — всё то же, что у остальных.
Плюсы, которые стоит заимствовать: sandbox-подход и физический tool binding — хорошая референс-реализация для нашего Layer «bounded».
Вердикт: не как база, а как источник инженерных решений. Высокое покрытие обманчиво — большая часть мимо нашего домена.
AutoGen
5.0 / 10
покрытие 50%усилие: высокоеfit ⭐⭐
Что дошить из нашего стека:
State management — GroupChat концептуально слабее state-графа. Stateful HiL-паузы придётся эмулировать через кастомные message handlers. Усилие: high.
Policy / durable / RAG / eval — всё сверху, интеграций из коробки нет.
Модель мультиагентности — conversation-driven, а не граф-driven. Это несовместимо с нашей картинкой «Planner → LangGraph → CrewAI».
Вердикт: research-tool. Не рекомендуется как основа enterprise-кейса — концептуальный mismatch с нашей stateful-схемой.
MetaGPT
3.5 / 10
покрытие 41%усилие: очень высокоеfit ⭐
Что дошить из нашего стека:
Отказ от SOP-парадигмы — MetaGPT жёстко зашивает SOP (Standard Operating Procedure) «виртуальной IT-компании». Для динамической оркестрации придётся переписать ядро. Усилие: very high.
HiL, policy, durable, RAG eval — всё отсутствует, всё сверху.
Вердикт: красивая демонстрация концепции ролевой декомпозиции, но как база production-стека — не подходит. Рекомендуется исключить из рассмотрения.