苹果推出换代AI大模型MM1.5 拥有自然语言推理
时间:2024-12-26 20:30:15 来源:恨海难填网 作者:休闲 阅读:951次
AI大潮下,苹果科技巨头苹果公司日前推出了300亿参数的推出多模态AI大模型MM1.5,该版本是换代在前代MM1的架构基础上发展而来的。
该模型继续遵循数据驱动的大模训练原则,着重探究在不同训练周期中混合各类数据对模型性能产生的拥有自言推影响,相关模型文档已在Hugging Face上发布。然语
MM1.5提供了从10亿到300亿的苹果多种参数规模,拥有图像识别和自然语言推理能力。推出
在新版本中,换代苹果公司的大模研发人员改进了数据混合策略,极大地增强了模型在多文本图像理解、拥有自言推视觉引用与定位以及多图像推理等方面的然语能力。
参考论文可知,苹果团队在MM1.5的推出持续预训练阶段引入了高质量的OCR数据和合成图像描述,这显著提高了模型对包含大量文本的换代图像的理解水平。
此外,研究人员在监督式微调阶段深入分析了不同数据类型对模型表现的作用,优化了视觉指令微调数据的混合方式,使得即便是小规模的模型(如10亿、30亿参数版本)也能有出色的发挥,实现了更高的效率。
值得一提的是,苹果公司这次还推出了专门用于视频理解的MM1.5-Video模型和专门处理移动设备用户界面(UI)理解的MM1.5-UI模型。
其中,MM1.5-UI模型未来有望成为iOS背后的“苹果牌”AI,能够处理各种视觉引用与定位任务,还能总结屏幕上的功能,或者通过与用户的对话进行交互。
尽管MM1.5模型在多项基准测试中表现优异,但苹果团队仍计划通过进一步融合文本、图像和用户交互数据,并设计更复杂的架构,来提升模型对移动设备UI的理解能力,从而让“苹果牌”AI更强大。
(责任编辑:娱乐)
最新内容
- ·😯真是营销骗局⁉️贝林厄姆绯闻女友否认恋情:不,我没有男友
- ·今年最后一次!超级月亮16日凌晨现身夜空
- ·卢伟冰抵达临沂:小米汽车交付中心即将建成 和特斯拉是邻居
- ·一个时代的结束!过去15年里,梅西和C罗赢得了13座金球奖
- ·内斯塔、加图索、皮尔洛、因扎吉、西多夫...转教练好像都不成功
- ·翻译救一下啊😂德罗巴提问说了半天,亚马尔害羞表示听不懂
- ·未来是你的!🌟亚马尔成为首位夺得科帕奖的18岁以下球员
- ·【直播】直播封烟!官方直播流把镜头给到K神摄像头,K神现场吞云吐雾
- ·记者:库普梅纳斯内收肌没有严重问题,预计不会被列入伤病名单
- ·[流言板]尴尬!内马尔&维尼修斯,巴西历史首次单届世预赛罚丢2点球
热点内容
- ·2024全球联赛射手排名:约克雷斯第1武磊34球第4,五大联赛仅凯恩
- ·[流言板]詹姆斯:雷迪什回归让我们有了可以承担外线对位的防守人
- ·金球奖第10名:31岁凯恩,生涯第6次提名
- ·记者:阿莫林不想赛季中期离开葡体,但去英超执教的梦想在推动他
- ·阿兹努谈未来:目前我不想被外租,明年将为拜仁一线队的位置而战
- ·到现场了!罗德里:我还不知道任何事,让我们拭目以待吧
- ·[流言板]尴尬!内马尔&维尼修斯,巴西历史首次单届世预赛罚丢2点球
- ·已进前十!劳塔罗与妻子一起走金球红毯
- ·[流言板]美记分享格林抢篮板拉倒两人被吹犯规调侃:太搞笑了追梦
- ·未来是你的!🌟亚马尔成为首位夺得科帕奖的18岁以下球员