谷歌：将通过 Gemini 2.0 驱动的人工智能代理开启“新代理时代”

金色精选 2024年12月12日 03:53

微信扫一扫
分享到朋友或朋友圈

作者：Stephen Katte，CoinTe；编译：陶朱，金色财经

谷歌人工智能研究实验室 DeepMind 表示，其最新发布的人工智能模型 Gemini 2.0 将成为构建更先进的人工智能代理的基础。

谷歌 DeepMind 首席执行官 Demis Hassabis 和首席技术官 Koray Kavukcuoglu 在 12 月 11 日的一篇博客文章中表示，12 月 11 日发布的 Gemini 2.0 驱动的人工智能代理可以理解复杂的指令、计划、推理、跨网站采取行动，甚至可以协助制定视频游戏策略。

Hassabis 和 Kavukcuoglu 表示：“人工智能代理的实际应用是一个充满激动人心的可能性的研究领域。

“我们正在通过一系列原型探索这一新领域，这些原型可以帮助人们完成任务并把事情做好。”

据 Hassabis 和 Kavukcuoglu 介绍，目前有多个由 Gemini 驱动的实验性 AI 助手项目，每个项目都具有不同的功能。

其中一个项目名为 Deep Research，它可以通过搜索网络创建多步骤研究计划，然后生成一份关于研究结果的长篇报告，从而帮助用户探索复杂的主题。

Project Astra 是一款通用 AI 助手，主要面向日常任务，例如根据用户提供的提示提供建议和意见，例如如何洗衣服或有关地标的更多信息。

Project Mariner 专注于创建一个 AI 代理，它可以控制您的 Chrome 浏览器、移动光标、单击按钮、填写表格和浏览网站。

据 Hassabis 和 Kavukcuoglu 介绍，这些项目“仍处于开发的早期阶段”，但他们希望在经过测试和进一步开发后，让它们“在未来的产品中得到广泛应用”。

“现在还为时过早，但 Mariner 项目表明，在浏览器中导航在技术上已经成为可能，尽管目前它完成任务并不总是准确且缓慢，但随着时间的推移，这种情况会迅速改善。”

与此同时，Jules 项目正在开发中，作为开发人员的助手，可以直接集成到 GitHub 工作流程中，并帮助完成编码和规划等任务。

Hassabis 和 Kavukcuoglu 表示，他们还使用 Gemini 2.0 为视频游戏构建了代理，可以在实时对话中为玩家提供下一步行动的建议，并在线搜索“丰富的游戏知识”。

“我们正在与 Supercell 等领先的游戏开发商合作，探索这些代理的工作方式，测试它们解释各种游戏规则和挑战的能力，从战略游戏到农业模拟器，”他们说。

11 月，美国云计算软件公司 Salesforce 的首席执行官马克·贝尼奥夫 (Marc Benioff) 表示，人工智能的未来在于自主代理，而不是大型语言模型 (LLM)。

“实际上，我认为我们现在已经达到了法学硕士的上限，”他在 11 月 23 日《华尔街日报》的“万物的未来”播客中说道。

Nvidia 也专注于将自己定位在趋势的前沿。

“我们看到 AI 原生公司的数量继续增长。当然，我们开始看到企业采用代理 AI 确实是最新的潮流，”Nvidia 首席执行官黄仁勋在 11 月的第三季度财报电话会议上表示。

此外，Hassabis 和 Kavukcuoglu 表示，该团队正在通过机器人技术“试验可以在物理世界中提供帮助的代理”。目前，谷歌的 AI 代理仅向测试人员和开发人员发布。

谷歌：将通过 Gemini 2.0 驱动的人工智能代理开启“新代理时代”

相关行情

热门资讯