当前位置：网站首页技术文章正文

谷歌发布Gemini 1.5 Pro支持原生音频理解。

来源：互联网发布时间：2024-06-24 09:40:56

创建或访问您的API密钥，开始构建。音频和视频模态的新用例：Gemini 1.5 Pro扩展了输入模态，包括在Gemini API和Google AI Studio中的音频（语音）理解。此外，Gemini 1.5 Pro现在能够对上传到Google AI Studio的视频进行图像（帧）和音频（语音）的跨模态推理，API支持即将推出。系统指令：在Google AI Studio和Gemini API中，通过系统指令指导模型的响应。定义角色、格式、目标和规则，以引导模型针对您的特定用例行为。JSON模式：指示模型仅输出JSON对象，此模式支持从文本或图像中提取结构化数据。您可以使用cURL开始，Python SDK支持即将到来。功能调用的改进：现在可以选择模式来限制模型的输出，提高可靠性。选择文本、功能调用或仅函数本身。

相关教程

重磅！谷歌免费开放Gemini Pro 的API，媲美ChatGPT！ 12月14日，谷歌在官网宣布，免费开放Gemini Pro和Gemini Pro Vision的API，支持中文。Gemini Pro隶属于谷歌前几天最新发布的大语言模型
技术文章 05-21
央视财经解密Sora：AI如何复刻人类的推理和直觉？ OpenAI发布第一个文生视频大模型Sora，立刻引发了广泛的关注和探讨。2月19日，我受邀做客央视财经2024年的全新专栏直播节目《光华录》，与
技术文章 05-20
英伟达联合推出 StarCoder2 模型，可执行生成、补全、调试代码文章摘要：英伟达联合Hugging Face和ServiceNow推出了StarCoder2模型，这是一个旨在成为代码生成领域新标准的LLMs系列模型。StarCoder2包
技术文章 05-20

产业资讯

微软2024 Build发布会:GPT-4o上云，纳德拉现场坦白OpenAI新模式和奥特曼剧透。

游戏下载 +

永恒时代最新版

类型：游戏下载大小：341.76M
下载
齐天战神正式版

类型：游戏下载大小：514.00M
下载
小花仙子游戏正式版

类型：游戏下载大小：976.07M
下载
最新版的西域

类型：游戏下载大小：1148.30M
下载
西游女儿国

类型：游戏下载大小：566.16M
下载

近期热点 +

最新技术文章 +

06-24

微软2024 Build发布会:GPT-4o上云，纳德拉现场坦白OpenAI新模式和奥特曼剧透。一夜之间，微软的AI全宇宙已经成型。今日凌晨，在一年一度的2024微软Build大会上，微软CEO萨蒂亚·纳德拉（Satya Nadella）一口气宣布了50
06-24

腾讯混动机型全面降价，主力机型当天免费。 5月22日，也就是今天，腾讯云宣布全面降价，立即生效。混合元素-lite模型API总输入输出长度计划从目前的4k升级到256k，价格从0 008元千令
06-24

普华永道成为OpenAI最大的客户和第一个分销合作伙伴。 ChatGPT企业平台超过60万家，覆盖93%的世界500强企业。周三，OpenAI宣布管理咨询巨头普华永道(PwC)成为其迄今为止最大的客户，覆盖10万用户。此外，普华永道将成为OpenAI第一个向其他企业销售Cha
06-24

腾讯元宝推出线上应用商店，支持AI搜索、总结、写作等能力。腾讯发布了一款名为的产品
06-24

黄仁勋最新两万字演讲:将打破摩尔定律，发布新产品，机器人时代已经到来。 6月2日，英伟达联合创始人兼CEO黄仁勋在Computex 2024(台北国际计算机展2024)发表主题演讲，分享人工智能时代如何助推全球新工业革命。以