当前位置：网站首页技术文章正文

Pixtral 12B 发布：Mistral开源首个多模态AI大模型

来源：互联网发布时间：2024-09-30 10:01:50

科技媒体 TechCrunch 昨日（9 月 11 日）报道，法国 AI 初创公司 Mistral 发布 Pixtral 12B，是该公司首款能够同时处理图像和文本的多模态 AI大语音模型。

Pixtral 12B 模型拥有 120 亿参数，大小约为 24GB，参数大致对应于模型的解题能力，拥有更多参数的模型通常比参数较少的模型表现更优。

Pixtral 12B 模型基于文本模型 Nemo 12B 构建，能够回答关于任意数量、任意尺寸图像的问题。

与 Anthropic 的 Claude 系列和 OpenAI 的 GPT-4o 等其他多模态模型类似，Pixtral 12B 理论上应能执行诸如为图像添加描述和统计照片中物体数量等任务。

用户可以下载、微调 Pixtral 12B 模型，并能依据 Apache 2.0 许可证使用。

Mistral 开发者关系负责人 Sophia Yang 在 X 平台的一篇帖子中表示，Pixtral 12B 很快将在 Mistral 的聊天机器人和 API 服务平台 Le Chat 及 Le Plateforme 上开放测试。

Pixtral12B发布：Mistral开源首个多模态AI大模型

在技术规格上，Pixtral12B同样令人印象深刻:40层网络结构、14，336个隐藏维度、32个注意力头，以及400M的专用视觉编码器，支持处理1024x1024分辨率的图像。

Pixtral12B发布：Mistral开源首个多模态AI大模型

在MMMU、Mathvista、ChartQA、DocVQA等平台上，它的成绩超越了包括Phi-3和Qwen-27B在内的多个知名多模态模型，充分证明了其强劲的实力。

huggingface地址:

https://huggingface.co/mistral-community/pixtral-12b-240910

相关内容：

估值 60 亿美元，法国 AI 初创公司 Mistral AI 即将达成新融资协议Mistral 发布其首个代码生成 AI 模型 CodestralMistral新模型Codestral Mamba 速度更快、文本处理长度是GPT-4o两倍法国AI初创公司Poolside估值20亿美元，计划融资4亿美元

相关教程

Transformer作者警告：光卖模型比不过OpenAI！ Transformer八子中最年轻的Aidan Gomez在最新访谈中分享：作为AI领域变革者之一的谷歌版Aidan Gomez，如今已是估值高达55亿美元的Cohere
技术文章 09-23
[技巧] 微软在Windows 11开始菜单中展示推荐广告下面是禁用方法微软在上周向 Windows 11 Beta 通道推送新版本测试新功能，这个新功能是在开始菜单的推荐部分里展示第三方软件的广告，例如 1Password
技术文章 08-21
企业开发者，怎么迎接编程自动化的新时代？｜聊聊百度孙珂的看法当国外的Cursor正引领AI编程潮流，国内的大企业也不甘落后，纷纷投身于这一领域的探索与实践。以百度为例，这家互联网巨头内部孕育了一款强
技术文章 09-26

产业资讯

我被古装美女包围了通关攻略我被古装美女包围了游戏全结局流程一览

蜜蜂剪辑有关音频分离和裁剪删问题教程_一分钟快速了解音频剪辑注意事项

王者灵宝市集刷几次出传说灵宝市集传说皮肤概率分享

游戏下载 +

末日小兵逃亡

类型：游戏下载大小：127.05MB
下载
警车模拟真实驾驶

类型：游戏下载大小：57.48MB
下载
重生细胞内置修改器(Dead Cells)

类型：游戏下载大小：1.9GB
下载
中国式人生(免广告)

类型：游戏下载大小：53.68MB
下载
触角博士(DrTentacles)

类型：游戏下载大小：44MB
下载

近期热点 +

最新技术文章 +

09-30

「Her」主创 Alexis Conneau 宣布从 OpenAI 离职，OpenAI GPT-4o 背后灵魂人物辞职创业最新消息，OpenAI的首席研究员，也是GPT-4o背后的灵魂人物Alexis Conneau，已经告别了老东家，毅然决然地踏上了创业的征途。他在社交平台
09-30

安卓版谷歌 Gemini Live 免费上线，开启在线AI语音畅聊科技媒体 9to5Google 昨日（9 月 12 日）发布博文，报道谷歌在 1 个月前面向 Advanced 订阅用户推出后，正逐步面向所有安卓用户免
09-30

全球人形机器人约 38% 供应链企业在中国，北京、上海、广东等地已成立具身智能机器人创新中心据央视财经报道，9 月 12 日至 16 日，2024 年中国国际服务贸易交易会将在北京举办。报道提到，目前，全球人形机器人约 38% 的供应
09-29

谷歌联合创始人布林：工程师们用 AI 编程还不够积极谷歌联合创始人谢尔盖・布林（Sergey Brin）表示，谷歌工程师并没有像他认为的那样经常使用人工智能。布林本周在洛杉矶举行的“All-In”峰
09-29

OpenAI发布具推理能力的人工智能模型，OpenAI o1模型登场 OpenAI 传闻中的“草莓”（Strawberry）AI模型现已面世，正式名称为“o1”，是该公司首款具备“推理”能力的模型。o1 和 o1-miniOpenAI