当前位置：网站首页软件教程正文

Project Astra： Google DeepMind 研发的一个具备视频理解能力的原型

来源：互联网发布时间：2024-07-09 23:31:32

Project Astra 是由 Google DeepMind 研发的一个研究原型，它具备视频理解能力，并且能够通过用户的设备摄像头和麦克风提供日常生活的帮助。在 Google I/O 2024 大会上，Google DeepMind 的首席执行官 Demis Hassabis 宣布了 Project Astra。

ProjectAstra：GoogleDeepMind研发的一个具备视频理解能力的原型

Project Astra 是 Google 推出的一个多模态 ai 项目，旨在开发一个能够实时解释用户摄像头画面中物品的 AI 助手

Project Astra 的功能特征：

多模态交互：Project Astra 允许用户通过语音、文本、绘图、拍照和视频等多种方式与之交互，提供了一个全面的交互体验。

实时识别与记忆：Astra 能够在不间断的视频中识别物品，并回忆起物品的位置。例如，它能够识别眼镜并指出它在桌子上的位置（靠近一个红苹果）。

代码解释：Astra 还能够解释屏幕上的代码，这表明它能够处理和理解复杂的视觉信息。

本地运行：Project Astra 基于 Gemini，可以本地运行在 Pixel 手机上，这表明它具有较高的处理速度和较低的延迟。

增强现实和人机交互：Project Astra 在增强现实和人机交互方面取得了重大进步，它让设备不仅仅是获取信息的工具，而是能够理解和参与我们日常生活的伙伴。

企业级存储和数据服务：值得注意的是，Project Astra 也被用作 NetApp 的一个项目名称，该项目旨在为 Kubernetes 提供企业级存储和数据服务平台。

与 OpenAI 的竞争：Google 的 Project Astra 与 OpenAI 的 GPT-4o 有相似之处，两者都在 AI 助手领域有相似的愿景，并且都在争夺相同的市场。

未来展望：Project Astra 的目标是将技术嵌入到手机和可穿戴设备中，成为我们日常生活中无处不在的助手。尽管目前 Astra 还处于原型阶段，但它已经展示了其在实时交互和多模态理解方面的潜力。

Project Astra 使用用户设备上的摄像头和麦克风，通过持续处理和编码视频帧和语音输入，创建事件的时间线并缓存信息以便快速回忆。这使得 AI 能够识别物体、回答问题，并记住它曾经看到过但已经不在摄像头视野中的事物。

Google 表示，尽管 Project Astra 目前仍处于早期阶段，并且没有具体的发布计划，但该公司暗示，这些能力中的一些可能会在今年晚些时候集成到像 Gemini 应用这样的产品中（以一个名为 "Gemini Live" 的特性），这将是开发有用 AI 助手的重要一步。Google CEO Sundar Pichai 表示，这是为了创造一个具有“代理性”的代理，能够“代表你思考、推理和规划”。

相关教程

精选活动!男生和女生抱萝卜需要准备什么7月1日复刻先祖放松日浴者位置兑换表光遇7 1复刻先祖能兑换什么？2021年7月1日的复刻先祖是放松日浴者，玩家想要
软件教程 05-22
驱动精灵怎么看电脑配置？-驱动精灵看电脑配置的操作流程？驱动精灵是一款驱动管理软件，那么驱动精灵怎么看电脑配置？驱动精灵看电脑配置的操作流程？下面就让小编给大家解答下吧!
软件教程 05-18
《书旗小说》金币兑换会员方法介绍书旗小说是一款非常好用的手机小说阅读软件，用户在这款软件上可以阅读自己喜欢的小说。最近有很多的用户不知道书旗小说金币兑换会员的方法是什么，接下来就由小编为大家介绍书旗小说
软件教程 05-27

产业资讯

游戏下载 +

会说话的汤姆猫九游版最新版

类型：游戏下载大小：73.67M
下载
无敌小飞侠游戏

类型：游戏下载大小：64.25M
下载
最佳11人手游最新版2024

类型：游戏下载大小：545.02M
下载
5e对战码友手机版

类型：游戏下载大小：82.35M
下载
急速竞赛狂飙手游

类型：游戏下载大小：42.38M
下载

近期热点 +

最新软件教程 +

07-09

天生会画App：华为自研专业绘画软件天生会画App是一款由华为自研并联合中国美术学院打造的专业绘画软件，具有多种智慧功能和便捷的绘画工具。天生会画App支持ai智能选区、快捷
07-09

以太坊ETH钱包怎么注册？以太坊ETF钱包注册方法以太坊ETH钱包怎么注册？以太坊ETF钱包注册方法以太坊ETF钱包怎么注册这个问题相信很多用户都很好奇的，对于一些新人用户来说刚接触数字货币还有很多是需要了解的，就像我们今天要为
07-09

VOISE币是什么币种？VOICE币未来发展前景如何？ VOICE币是一种基于区块链技术的数字货币，目的是提供高速的交易并保持系统的去中心化特性，旨在保护用户隐私、改善社交媒体的透明度和公正性，这意味着用户可以通过VOICE币实现即时交
07-09

VOICE币值得投资吗？VOICE币去哪里交易买卖？ VOICE币是一种基于区块链技术的数字货币，它是由VOICE社交媒体平台所推出的，旨在保护用户隐私，改善社交媒体的透明度和公正性，常常可以用于购买商品和服务、打赏内容创作者以及参与
07-09

PaliGemma：Google推出的开源视觉语言模型 PaliGemma是Google开发并发布的具有多模态功能的视觉语言模型（VLM）。与其他 VLM（例如 Openai 的 GPT-4o、Google Gemini 和 Ant