首页 抖音热门文章正文

谷歌发布新型扩散智能体,仿人类写作流程提升企业研究效率

抖音热门 2025年08月08日 00:51 1 admin

谷歌发布新型扩散智能体,仿人类写作流程提升企业研究效率

谷歌研究人员开发了一种新的AI研究智能体框架,在关键基准测试中超越了OpenAI、Perplexity等竞争对手的主流系统。

这个新智能体名为"测试时扩散深度研究员"(TTD-DR),其设计灵感来自人类的写作过程——通过起草、搜索信息和迭代修订的方式工作。

该系统使用扩散机制和进化算法,能够对复杂主题产生更全面、更准确的研究结果。对于企业而言,这一框架可以为高价值任务提供新一代定制研究助手,处理标准检索增强生成(RAG)系统难以应对的任务,如生成竞争分析或市场进入报告。

论文作者表示,这些现实世界的商业用例正是该系统的主要目标。

**当前深度研究智能体的局限性**

深度研究(DR)智能体旨在处理超越简单搜索的复杂查询。它们使用大语言模型进行规划,利用网络搜索等工具收集信息,然后借助测试时扩展技术(如思维链、最佳N采样和蒙特卡洛树搜索)将发现综合成详细报告。

然而,许多现有系统存在根本的设计限制。大多数公开可用的DR智能体在应用测试时算法和工具时,缺乏反映人类认知行为的结构。开源智能体通常遵循僵化的线性或并行过程,使研究的不同阶段难以相互作用和纠正。

这可能导致智能体失去研究的全局上下文,错过不同信息片段之间的关键联系。论文作者指出:"这表明当前DR智能体工作存在根本局限性,突显了需要一个更连贯、专用的DR智能体框架来模仿或超越人类研究能力。"

**受人类写作和扩散启发的新方法**

与大多数AI智能体的线性过程不同,人类研究人员采用迭代方式工作。他们通常从高层计划开始,创建初始草稿,然后进行多轮修订。在修订过程中,他们搜索新信息以强化论点并填补空白。

谷歌研究人员观察到,这种人类过程可以通过增强检索组件的扩散模型机制来模拟。(扩散模型常用于图像生成,从噪声图像开始,逐渐细化直到成为详细图像。)

研究人员解释:"在这个类比中,训练好的扩散模型初始生成一个噪声草稿,去噪模块在检索工具的帮助下,将此草稿修订为更高质量的输出。"

TTD-DR基于此蓝图构建。该框架将研究报告的创建视为扩散过程,初始的"噪声"草稿逐渐细化为精美的最终报告。

这通过两个核心机制实现。第一个机制称为"带检索的去噪",从初步草稿开始迭代改进。在每步中,智能体使用当前草稿制定新的搜索查询,检索外部信息,并整合它们来"去噪"报告——纠正错误并添加细节。

第二个机制"自进化"确保智能体的每个组件(规划器、问题生成器和答案合成器)独立优化自身性能。论文共同作者、谷歌研究科学家韩如君向VentureBeat解释,这种组件级进化至关重要,因为它使"报告去噪更加有效"。

"这两种算法的复杂相互作用和协同组合对实现高质量研究成果至关重要,"作者表示。这种迭代过程直接产生不仅更准确,而且逻辑更连贯的报告。

据论文称,生成的研究助手"能够为跨金融、生物医学、娱乐和技术等多个行业领域的复杂研究问题生成有用且全面的报告",使其与OpenAI、Perplexity和Grok的深度研究产品处于同一级别。

**TTD-DR的表现**

为构建和测试框架,研究人员使用了谷歌的智能体开发工具包(ADK),这是一个用于编排复杂AI工作流的可扩展平台,以Gemini 2.5 Pro作为核心大语言模型。

他们将TTD-DR与包括OpenAI Deep Research、Perplexity Deep Research、Grok DeepSearch和开源GPT-Researcher在内的主流商业和开源系统进行基准比较。

评估重点关注两个主要领域。对于生成长篇综合报告,他们使用DeepConsult基准和自己的LongForm Research数据集。对于需要大量搜索和推理的多跳问题回答,他们在HLE和GAIA等具有挑战性的学术和现实世界基准上测试智能体。

结果显示TTD-DR持续超越竞争对手。在与OpenAI Deep Research的长篇报告生成对比中,TTD-DR在两个不同数据集上实现了69.1%和74.5%的胜率。它还在三个需要多跳推理的基准上超越OpenAI系统,性能提升分别为4.8%、7.7%和1.7%。

**测试时扩散的未来**

虽然当前研究专注于使用网络搜索的基于文本报告,但该框架设计为高度适应性。韩如君确认团队计划扩展工作,纳入更多工具用于复杂企业任务。

类似的"测试时扩散"过程可用于生成复杂软件代码、创建详细财务模型或设计多阶段营销活动,其中项目的初始"草稿"通过新信息和各种专业工具的反馈进行迭代细化。

韩如君表示:"所有这些工具都可以自然地纳入我们的框架",暗示这种以草稿为中心的方法可能成为各种复杂、多步骤AI智能体的基础架构。

Q&A

Q1:TTD-DR与传统AI研究智能体有什么不同?

A:TTD-DR模仿人类写作过程,采用迭代方式工作——从初始草稿开始,通过多轮修订和信息搜索逐步完善。而传统智能体多采用僵化的线性过程,各阶段难以相互作用和纠正,容易失去全局上下文。

Q2:TTD-DR在性能测试中表现如何?

A:TTD-DR在基准测试中持续超越竞争对手。与OpenAI Deep Research的对比中,在长篇报告生成方面实现69.1%和74.5%的胜率,在多跳推理基准上性能提升4.8%、7.7%和1.7%。

Q3:TTD-DR的两个核心机制是什么?

A:第一个是"带检索的去噪",从初步草稿开始迭代改进,通过搜索查询检索信息并整合来纠正错误;第二个是"自进化",确保规划器、问题生成器和答案合成器等各组件独立优化性能,使报告去噪更加有效。

发表评论

泰日号Copyright Your WebSite.Some Rights Reserved. 网站地图 备案号:川ICP备66666666号 Z-BlogPHP强力驱动