当前位置：网站首页技术文章正文

Google 发布 Gemini 1.5 Pro，支持原生音频理解

来源：互联网发布时间：2024-05-19 12:33:50

创建或访问您的API密钥，开始构建。音频和视频模态的新用例：Gemini 1.5 Pro扩展了输入模态，包括在Gemini API和Google AI Studio中的音频（语音）理解。此外，Gemini 1.5 Pro现在能够对上传到Google AI Studio的视频进行图像（帧）和音频（语音）的跨模态推理，API支持即将推出。系统指令：在Google AI Studio和Gemini API中，通过系统指令指导模型的响应。定义角色、格式、目标和规则，以引导模型针对您的特定用例行为。JSON模式：指示模型仅输出JSON对象，此模式支持从文本或图像中提取结构化数据。您可以使用cURL开始，Python SDK支持即将到来。功能调用的改进：现在可以选择模式来限制模型的输出，提高可靠性。选择文本、功能调用或仅函数本身。

相关教程

马斯克发布Grok-1.5，强化推理和上下文，HumanEval得分超GPT-4 AIHub最新消息，继开源
技术文章 05-19
ChatGPT模型大更新！全新大、小文本嵌入模型，API价格大降价 1月26日凌晨，OpenAI在官网对ChatGPT模型进行了大更新，发布了两款全新大、小文本嵌入模型，全新的GPT-4Turbo模型（修复懒惰行为），免费的
技术文章 05-21
OpenAI 在东京开设亚洲首个办事处，将发布日语优化型 GPT-4 模型 4 月 15 日，OpenAI 今日通过官方博客页面宣布，公司在亚洲的首个办事处落户日本东京，将业务扩展到亚洲。OpenAI 表示将致力于与当地
技术文章 05-19

产业资讯

游戏下载 +

绝地求生2pubg new state手机版

类型：游戏下载大小：1490.00M
下载
独奏骑士最新版

类型：游戏下载大小：547.03M
下载
濡沫江湖官方版

类型：游戏下载大小：490.79M
下载
租号玩手机客户端

类型：游戏下载大小：144.32M
下载
重生细胞官方正版

类型：游戏下载大小：1854.21M
下载

近期热点 +

最新技术文章 +

05-21

Stability AI发布30亿参数轻量模型今日，AI独角兽Stability AI推出30亿参数的聊天模型StableLM Zephyr 3B，可满足从简单查询到边缘设备上的复杂教学语境等各种文本生成需
05-21

OpenAI 重新开放 ChatGPT Plus 新粉丝注册在 ChatGPT Plus 暂停新用户注册一个月之后，重返 OpenAI 的首席执行官萨姆·奥特曼(Sam Altman)在
05-21

工信部：今年我国生成式AI市场规模14.4万亿元 12月14日消息，据央视《新闻直播间》今日报道，记者从工业和信息化部赛迪研究院获悉，今年我国AI企业新增368家，生成式AI的企业采用率已
05-21

重磅！谷歌免费开放Gemini Pro 的API，媲美ChatGPT！ 12月14日，谷歌在官网宣布，免费开放Gemini Pro和Gemini Pro Vision的API，支持中文。Gemini Pro隶属于谷歌前几天最新发布的大语言模型
05-21

吐司tusi ComfyUI 工作台上线啦！真随心所欲出图，让可控更可控！终于，去使用。