论文笔记:The Landscape of Emerging AI Agent Architectures for Reasoning, Planning, and Tool Calling : A Survey

tags
论文
date
Apr 25, 2024
slug
papar-note-the-landscape-of-emerging-AI-Agent
status
Published
summary
Agent Persona。代理人格描述了代理应该扮演的角色或性格,包括针对该代理的任何其他特定指示。
type
Post
cover
SCR-20240425-ofvw.png

1.1 分类

  • Agents:人工智能代理是由语言模型驱动的实体,能够计划并采取行动,以在多次迭代中执行目标。
  • Agent Persona(角色): Agent Persona。代理人格描述了代理应该扮演的角色或性格,包括针对该代理的任何其他特定指示。
  • 工具: 工具。在人工智能代理的上下文中,工具代表模型可以调用的任何函数。他们允许代理通过拉取或推送信息到该源与外部数据源进行交互。
  • 单一代理架构: 单一代理架构。这些架构由一个语言模型驱动,并将自己进行所有的推理、规划和工具执行。
  • 多代理架构: 多代理架构。这些架构涉及两个或更多的代理,其中每个代理可以使用相同的语言模型或一组不同的语言模型。代理可能可以访问相同的工具或不同的工具。每个代理通常都有自己的人格。
  • 垂直架构: 垂直架构。在这种结构中,一个代理充当领导者,其他代理直接向他们汇报。
  • 水平架构: 水平架构。在这种结构中,所有代理被视为平等,并参与一个围绕任务的小组讨论。

2. 有效代理的关键考虑因素

2.1 推理和规划

推理,人类认知的基础构建块,使人们能够做出决策、解决问题和理解我们周围的世界。如果AI代理要有效地与复杂环境交互,做出自主决策,并在广泛的任务中协助人类,那么他们就需要强大的推理能力。(代理需要理解推理能力来获取上下文并在复杂环境下进行交互)。
规划,需要强大的推理能力,通常分为五种主要方法:任务分解,多计划选择,外部模块辅助规划,反思和改进以及记忆增强规划(规划,在推理的基础上)。

2.2 工具调用

代理抽象优于提示基础语言模型的一个主要好处是代理能够通过调用多个工具来解决复杂问题。这些工具使代理能够与外部数据源交互,从现有的API中发送或检索信息,等等。需要大量工具调用的问题通常与需要复杂推理的问题相辅相成。
许多方法使用推理、记忆和反思的多次迭代来有效和准确地完成问题。他们通常通过将一个较大的问题分解为较小的子问题,然后按顺序使用适当的工具来解决每一个问题。

3. 单一代理架构

如果没有自我评估和创建有效计划的能力,单一代理可能会陷入无尽的执行循环,永远无法完成给定的任务或返回不符合用户期望的结果 我们发现,当任务需要直接调用功能并且不需要来自另一个代理的反馈时,单一代理架构尤其有用

4. 多代理架构

通过将代理的角色和技能与手头的任务相匹配,代理团队可以获得更高的准确性,减少达到目标的时间。有效的多代理架构的关键特性包括代理团队中的明确领导,动态团队构建,以及团队成员之间的有效信息共享,以免重要信息在过多的聊天中丢失。
notion image

5. 讨论和观察

5.1 代理和异步任务执行

这意味着,虽然任务是异步处理的,但它们并非真正并行,因为它们并非由单独的决策实体自主管理。相反,单一代理必须按顺序规划和执行任务,等待一批异步操作完成后,才能评估并进行下一步。相反,在多代理架构中,每个代理可以独立操作,允许更动态的劳动分工。这种结构不仅促进了在不同领域或目标之间的同时任务执行,而且还允许单个代理在不受其他人处理的任务状态阻碍的情况下进行下一步,体现了对任务管理更灵活和并行的方法。

5.2 对代理系统的反馈和人类监督的影响

此外,包括人类监督可以改善立即的结果,使代理的响应更接近人类的预期,减轻代理深入无效或低效解决任务方法的可能性。

5.3 与群体对话和信息共享的挑战。

多代理架构的一个挑战在于他们在智能分享代理之间的信息的能力。

5.4 角色定义和动态团队的影响。

明确的角色定义对单一代理架构和多代理架构都是至关重要的。在单一代理架构中,角色定义确保代理专注于提供的任务,执行适当的工具,并最小化其他能力的幻觉。同样,在多代理架构中,角色定义确保每个代理都知道他们在整个团队中负责什么,不会承担超出他们描述的能力或范围的任务。

© JediXL 2021 - 2024