数字员工平台架构设计

多角色、可定制 Skill、多渠道接入的统一运行时智能代理平台

Based on DeerFlow — LangGraph Super Agent 架构

01 用户故事

从不同角色视角出发，描述平台如何为终端用户、业务方和平台管理员提供价值。

💬

通过 Web 咨询客服数字员工

角色: 终端用户 (C端客户)

作为一名客户，我在网站上遇到了产品使用问题，希望快速获得解答。

1打开网页客服窗口，系统自动分配「智能客服」数字员工
2输入问题，数字员工通过 faq-retrieval Skill 检索知识库
3如问题无法解答，自动调用 ticket-management Skill 创建工单
4整个过程无需 Sandbox，Memory 记住我的偏好和历史问题

渠道: Web 前端

📊

在钉钉中让数据分析师生成报表

角色: 业务运营人员

作为一名运营人员，我需要每周从数据库中提取数据并生成可视化报表。

1在钉钉群中 @数据分析师并说「帮我出上周 GMV 报表」
2钉钉 Bot 通过 Webhook 转发到数字员工平台
3数据分析师启用 Sandbox 执行 SQL 查询 + Python 画图
4chart-visualization Skill 生成图表，回传到钉钉群

渠道: 钉钉 / IM Bot

🔧

告警触发自动运维处理

角色: SRE / 运维工程师

作为一名SRE，当生产环境触发告警时，希望数字员工自动诊断并通过工具接口执行修复。

1监控系统检测到 CPU 告警，通过 Webhook 触发运维员工
2运维员工调用监控诊断工具，通过 API 采集指标分析根因
3infra-scaling Skill 通过运维平台 API 执行服务扩容/重启
4处理结果推送到钉钉通知 SRE 确认

渠道: Webhook / API

🛠️

业务方创建并维护自定义 Skill

角色: 业务开发者

作为一名业务开发者，我希望为我的团队定制专属的数字员工技能，无需等待平台方开发。

1在 skills/custom/ 目录下创建 Skill 目录和 SKILL.md
2编写 scripts/、references/ 和配置 tags/scenes 标签
3通过管理控制台或 API 启用 Skill 并绑定到目标员工
4平台热加载，无需重启即可生效

渠道: 管理控制台 / CLI

🔌

将数字员工能力嵌入业务系统

角色: 业务系统开发者

作为一名业务系统开发者，我希望在自己的应用中直接调用数字员工的能力，而不是跳转到独立页面。

1通过 Python SDK (DeerFlowClient) 在后端嵌入调用
2指定 employee_id 选择合适的数字员工角色
3通过 stream() 获取流式响应，实时推送到业务 UI
4共享平台的 Sandbox、Memory、Skill 运行时能力

渠道: Python SDK / REST API

👑

平台管理员配置和监控数字员工

角色: 平台管理员

作为平台管理员，我需要创建员工 Profile、审核 Skill、监控运行状态。

1在管理控制台创建新的员工 Profile (YAML 配置)
2从 Skill 注册中心选择并绑定技能到员工
3审核业务方提交的自定义 Skill (代码安全检查)
4监控各员工的调用量、响应时间、Memory 使用情况

渠道: 管理控制台

02 多渠道接入

用户可以通过多种渠道接入数字员工平台，统一路由到后端运行时执行。

MULTI-CHANNEL ACCESS — 统一接入架构

🌐

Web 前端

Next.js 应用，SSE 流式对话，管理控制台一体化

LangGraph SDK + SSE

💬

IM Bot

钉钉、企业微信群内 @机器人直接对话

Bot Gateway + Webhook

🔌

REST API

标准 OpenAPI 接口，支持同步和流式两种模式

FastAPI + OpenAPI 3.0

🐍

Python SDK

嵌入式客户端，无需 HTTP 直接在进程内调用

DeerFlowClient

🪝

Webhook

监控告警、CI/CD 事件触发自动化任务执行

HTTP POST + Callback

🔗

MCP Protocol

作为 MCP Server 暴露能力给 Claude / Cursor

stdio / SSE / HTTP

03 总体架构全景

平台分为四层：接入层、调度层、运行时层、基础设施层。不同场景的数字员工通过 Profile 定义，绑定不同的 Skill 组合。

PLATFORM OVERVIEW — 四层架构

04 目标架构：多角色数字员工平台

引入 Employee Profile 层，不同数字员工可绑定不同的 Skill 组合，拥有独立 Memory，按需启用 Sandbox。

TARGET — MULTI-ROLE DIGITAL EMPLOYEE PLATFORM

05 Skill 自维护体系

业务方可以自主创建、维护、发布 Skill，通过 API 或管理控制台绑定到目标数字员工，平台热加载无需重启。

SKILL LIFECYCLE — 业务自维护全流程

平台方 (public Skills)

PLATFORM-MANAGED

内置通用技能，所有员工可使用
skills/public/ 目录，随代码发布
chart-visualization / image-gen / find-skills
平台团队维护，质量和安全有保障
默认 enabled，可通过配置关闭

业务方 (custom Skills)

BUSINESS-MANAGED

业务团队自主开发和维护
skills/custom/ 目录，.gitignore 隔离
ticket-management / sql-query / infra-scaling
通过 tags/scenes 控制适用范围
API 安装 / 管理控制台上传 / CLI 创建

06 Skill 系统扩展

在现有 SKILL.md 元数据基础上增加 tags 和 scenes 字段，实现按员工角色过滤加载。

SKILL REGISTRY — ENHANCED WITH TAGS, SCENES AND FILTERING

07 运行时层详解

Sandbox 和 Memory 作为平台级运行时能力，支持按员工配置策略。

Sandbox 运行时

CODE EXECUTION ENVIRONMENT

Provider 抽象: Local / Docker / K8s
虚拟路径映射: /mnt/user-data 双向映射
按员工配置: enabled / provider / timeout
客服类员工关闭 Sandbox 降低风险
运维类员工通过 API 工具调用运维接口
资源限制: timeout / memory / 命令白名单
工具集: bash / ls / read / write / str_replace

Memory 三级存储

LAYERED MEMORY SYSTEM

全局 Memory: 平台级知识，所有员工共享
员工 Memory: 角色专属知识和偏好
线程 Memory: 单次会话上下文（已有）
LLM 抽取 + 去抖队列 + 原子写入
分层注入: 全局+员工合并到 Prompt
存储: .deer-flow/employees/{id}/memory.json
Token 限额: max_injection_tokens 按层分配

08 端到端数据流

一个完整请求从用户选择数字员工到获得响应的全流程。

END-TO-END DATA FLOW — 多渠道请求到响应

用户通过任意渠道发起请求

Web 前端 / 钉钉 Bot / REST API / Python SDK / Webhook / MCP，携带 employee_id + message

统一接入网关协议适配

Nginx 反向代理 + FastAPI Gateway 完成鉴权、限流、协议转换，统一为内部 employee_id + message 格式

Employee Router 路由分发

从 config.configurable.employee_id 提取员工 ID，调用 make_employee_agent(config)

Agent Factory 动态构建

加载 Profile → 筛选绑定的 Skills → 过滤允许的 Tools → 组装 Middleware → 构建角色系统提示词 → 创建 Agent 实例

Middleware 链执行 (before_agent)

ThreadData → Uploads → Sandbox（按 Profile 决定是否启用）→ Memory 注入（全局 + 员工级合并）

ReAct Loop 执行

LLM 推理 → 调用 Tools → Skill 渐进式加载 (read_file SKILL.md) → Sandbox 代码执行 → 循环直到任务完成

Middleware 链执行 (after_agent)

Title 生成 → Memory 异步更新（去抖 30s，更新到员工级 employees/{id}/memory.json）

响应回传到原渠道

SSE Stream → Web/API | Webhook Callback → 钉钉 | SDK Return → 业务系统 | MCP Response → Cursor/Claude

09 数字员工示例

不同场景的数字员工，绑定不同的 Skill 组合和运行时配置。