谷歌:将通过 Gemini 2.0 驱动的人工智能代理开启“新代理时代”
作者:Stephen Katte,CoinTe;编译:陶朱,金色财经
谷歌人工智能研究实验室 DeepMind 表示,其最新发布的人工智能模型 Gemini 2.0 将成为构建更先进的人工智能代理的基础。
谷歌 DeepMind 首席执行官 Demis Hassabis 和首席技术官 Koray Kavukcuoglu 在 12 月 11 日的一篇博客文章中表示,12 月 11 日发布的 Gemini 2.0 驱动的人工智能代理可以理解复杂的指令、计划、推理、跨网站采取行动,甚至可以协助制定视频游戏策略。
Hassabis 和 Kavukcuoglu 表示:“人工智能代理的实际应用是一个充满激动人心的可能性的研究领域。
“我们正在通过一系列原型探索这一新领域,这些原型可以帮助人们完成任务并把事情做好。”
据 Hassabis 和 Kavukcuoglu 介绍,目前有多个由 Gemini 驱动的实验性 AI 助手项目,每个项目都具有不同的功能。
其中一个项目名为 Deep Research,它可以通过搜索网络创建多步骤研究计划,然后生成一份关于研究结果的长篇报告,从而帮助用户探索复杂的主题。
Project Astra 是一款通用 AI 助手,主要面向日常任务,例如根据用户提供的提示提供建议和意见,例如如何洗衣服或有关地标的更多信息。
Project Mariner 专注于创建一个 AI 代理,它可以控制您的 Chrome 浏览器、移动光标、单击按钮、填写表格和浏览网站。
据 Hassabis 和 Kavukcuoglu 介绍,这些项目“仍处于开发的早期阶段”,但他们希望在经过测试和进一步开发后,让它们“在未来的产品中得到广泛应用”。
“现在还为时过早,但 Mariner 项目表明,在浏览器中导航在技术上已经成为可能,尽管目前它完成任务并不总是准确且缓慢,但随着时间的推移,这种情况会迅速改善。”
与此同时,Jules 项目正在开发中,作为开发人员的助手,可以直接集成到 GitHub 工作流程中,并帮助完成编码和规划等任务。
Hassabis 和 Kavukcuoglu 表示,他们还使用 Gemini 2.0 为视频游戏构建了代理,可以在实时对话中为玩家提供下一步行动的建议,并在线搜索“丰富的游戏知识”。
“我们正在与 Supercell 等领先的游戏开发商合作,探索这些代理的工作方式,测试它们解释各种游戏规则和挑战的能力,从战略游戏到农业模拟器,”他们说。
11 月,美国云计算软件公司 Salesforce 的首席执行官马克·贝尼奥夫 (Marc Benioff) 表示,人工智能的未来在于自主代理,而不是大型语言模型 (LLM)。
“实际上,我认为我们现在已经达到了法学硕士的上限,”他在 11 月 23 日《华尔街日报》的“万物的未来”播客中说道。
Nvidia 也专注于将自己定位在趋势的前沿。
“我们看到 AI 原生公司的数量继续增长。当然,我们开始看到企业采用代理 AI 确实是最新的潮流,”Nvidia 首席执行官黄仁勋在 11 月的第三季度财报电话会议上表示。
此外,Hassabis 和 Kavukcuoglu 表示,该团队正在通过机器人技术“试验可以在物理世界中提供帮助的代理”。目前,谷歌的 AI 代理仅向测试人员和开发人员发布。