首页 资讯 正文

谷歌:将通过 Gemini 2.0 驱动的人工智能代理开启“新代理时代”

金色精选 2024年12月12日 03:53

作者:Stephen Katte,CoinTe;编译:陶朱,金色财经

谷歌人工智能研究实验室 DeepMind 表示,其最新发布的人工智能模型 Gemini 2.0 将成为构建更先进的人工智能代理的基础。

谷歌 DeepMind 首席执行官 Demis Hassabis 和首席技术官 Koray Kavukcuoglu 在 12 月 11 日的一篇博客文章中表示,12 月 11 日发布的 Gemini 2.0 驱动的人工智能代理可以理解复杂的指令、计划、推理、跨网站采取行动,甚至可以协助制定视频游戏策略。

Hassabis 和 Kavukcuoglu 表示:“人工智能代理的实际应用是一个充满激动人心的可能性的研究领域。

“我们正在通过一系列原型探索这一新领域,这些原型可以帮助人们完成任务并把事情做好。”

据 Hassabis 和 Kavukcuoglu 介绍,目前有多个由 Gemini 驱动的实验性 AI 助手项目,每个项目都具有不同的功能。

其中一个项目名为 Deep Research,它可以通过搜索网络创建多步骤研究计划,然后生成一份关于研究结果的长篇报告,从而帮助用户探索复杂的主题。

Project Astra 是一款通用 AI 助手,主要面向日常任务,例如根据用户提供的提示提供建议和意见,例如如何洗衣服或有关地标的更多信息。

Project Mariner 专注于创建一个 AI 代理,它可以控制您的 Chrome 浏览器、移动光标、单击按钮、填写表格和浏览网站。

据 Hassabis 和 Kavukcuoglu 介绍,这些项目“仍处于开发的早期阶段”,但他们希望在经过测试和进一步开发后,让它们“在未来的产品中得到广泛应用”。

“现在还为时过早,但 Mariner 项目表明,在浏览器中导航在技术上已经成为可能,尽管目前它完成任务并不总是准确且缓慢,但随着时间的推移,这种情况会迅速改善。”

与此同时,Jules 项目正在开发中,作为开发人员的助手,可以直接集成到 GitHub 工作流程中,并帮助完成编码和规划等任务。

Hassabis 和 Kavukcuoglu 表示,他们还使用 Gemini 2.0 为视频游戏构建了代理,可以在实时对话中为玩家提供下一步行动的建议,并在线搜索“丰富的游戏知识”。

“我们正在与 Supercell 等领先的游戏开发商合作,探索这些代理的工作方式,测试它们解释各种游戏规则和挑战的能力,从战略游戏到农业模拟器,”他们说。

11 月,美国云计算软件公司 Salesforce 的首席执行官马克·贝尼奥夫 (Marc Benioff) 表示,人工智能的未来在于自主代理,而不是大型语言模型 (LLM)。

“实际上,我认为我们现在已经达到了法学硕士的上限,”他在 11 月 23 日《华尔街日报》的“万物的未来”播客中说道。

Nvidia 也专注于将自己定位在趋势的前沿。

“我们看到 AI 原生公司的数量继续增长。当然,我们开始看到企业采用代理 AI 确实是最新的潮流,”Nvidia 首席执行官黄仁勋在 11 月的第三季度财报电话会议上表示。

此外,Hassabis 和 Kavukcuoglu 表示,该团队正在通过机器人技术“试验可以在物理世界中提供帮助的代理”。目前,谷歌的 AI 代理仅向测试人员和开发人员发布。

查看更多