此文章的内容来自MetaGPT官方文档,记录在此以加深自己的记忆和理解。
参考文档:概念简述 | MetaGPT (deepwisdom.ai)
智能体=LLM+观察+思考+行动+记忆
- LLM:大语言模型
- 观察:接受外界输入(文本,视频,音频等)
- 思考:可以由LLM驱动,分析外界输入并考虑决策
- 行动:智能体对思考+观察的显式的响应(利用LLM生成代码、提前定义的操作、使用工具的操作)
- 记忆:存储历史经验
多智能体=智能体+环境+SOP(标准流程)+通信+经济
- 智能体:如 智能体=LLM+观察+思考+行动+记忆 所介绍
- 环境:智能体存在和互动的场所。智能体从环境中
观察信息,并发布行动的输出结果给其他智能体使用 - SOP:一套管理智能体行动的标准,确保智能体之间的有序和高校协作。比如软件开发的SOP(产品经理智能体分析需求,架构师智能体设计架构,工程师智能体开发代码,测试智能体测试)
- 通信:智能体之间
信息交流的过程 - 经济:经济是多智能体
环境中的价值交换系统,决定着资源分配和任务优先级
例子

我参考(照抄)官方文档中的例子,重绘了一个展示智能体如何工作的图:
- 在环境中存在A、B、C三个智能体相互协作
- 他们可以将消息或者行动的输出结果发布到环境中,同时也会被其他智能体观察到
- 图中详细展示了智能体C的内部过程,此过程也适用于A和B
- C观察来自A的相关文件和B的需求,获取有帮助的记忆,思考如何编写代码,执行编写代码的行动
- C将结果发布发布到环境中并通知B。B在接收到回复Good