12月14日,谷歌在官网宣布,免费开放Gemini Pro和Gemini Pro Vision的API,支持中文。
Gemini Pro隶属于谷歌前几天最新发布的大语言模型Gemini家族,性能强、能耗低可自动生成文本/代码、总结内容、语义检索等。支持32K上下文(下一个版本会更大),38种语言。
目前,谷歌的类ChatGPT聊天产品Bard使用的就是Gemini Pro模型。
Gemini Pro Vision是谷歌最新推出的多模态模型,可以识别用户输入的图片,同样免费提供API。
开发者可以在网页版的开发平台Google AI Studio中免费访问这两个API,每分钟可发出60个请求,将比其他免费产品高20倍。
免费API地址:
如何使用Gemini Pro和Vision模型
1)拿到API后,我们可以在网页版开发平台Google AI Studio中测试一下。
点击“Create new”,然后选择“Freeform prompt”自由提示。
2)进入页面后,选择右侧的Gemini Pro模型,然后用中文在输入框中测试一下,“能介绍一下中国最伟大大的诗人吗?”,再点击下方的“Run”。
3)我们可以看到,回答的完全没问题。
4)我们继续使用model选项,然后切换至Gemini Pro Vision模型,用图片来提问一下测试他的多模态能力。
5)例如,输入一只狗狗的照片,然后提问“这是一只什么狗?,它在想什么呢?”。
6)可以看到Gemini Pro Vision模型已经回答了内容,这是一只猎兔犬,在想着何时可以出去玩。
需要注意的是,在Google AI Studio中开发的代码,是可以导入到本地开发环境的。
在Vertex AI中使用如果你因为应用环境等原因,不能在Google AI Studio中使用,可以在谷歌云的Vertex AI中使用。
但是就不能白嫖啦,输入和输出都是收费的。所以,大家尽量还是在Google AI Studio平台中使用,开发完代码后再导入到本地或其他公有云中。