您现在的位置是:欧亿 > 娱乐
蚂蚁集团开源欧义全模态大模型Ming
欧亿2026-03-03 20:56:15【娱乐】4人已围观
简介欧亿交易所提供风险等级分类服务,保障用户安全,下载欧亿APP,根据风险等级选择投资产品,实现稳健投资。
【TechWeb】2月11日消息,蚂蚁模型蚂蚁集团开源发布全模态大模型 Ming-Flash-Omni 2.0。集团在多项公开基准测试中,开源欧义该模型在视觉语言理解、全模语音可控生成、蚂蚁模型图像生成与编辑等关键能力表现突出。集团
据介绍,开源Ming-Flash-Omni 2.0是全模业界首个全场景音频统一生成模型,可在同一条音轨中同时生成语音、蚂蚁模型欧义环境音效与音乐。集团用户只需用自然语言下指令,开源即可对音色、全模语速、蚂蚁模型语调、集团音量、开源情绪与方言等进行精细控制。模型在推理阶段实现了 3.1Hz 的极低推理帧率,实现了分钟级长音频的实时高保真生成,在推理效率与成本控制上保持业界领先。

业内普遍认为,多模态大模型最终会走向更统一的架构,让不同模态与任务实现更深层协同。但现实是,“全模态”模型往往很难同时做到通用与专精:在特定单项能力上,开源模型往往不及专用模型。蚂蚁集团在全模态方向已持续投入多年,Ming-Omni系列正是在这一背景下持续演进:早期版本构建统一多模态能力底座,中期版本验证规模增长带来的能力提升,而最新2.0版本通过更大规模数据与系统性训练优化,将全模态理解与生成能力推至开源领先水平,并在部分领域超越顶级专用模型。
此次将 Ming-Flash-Omni 2.0 开源,意味着其核心能力以“可复用底座”的形式对外释放,为端到端多模态应用开发提供统一能力入口。
Ming-Flash-Omni 2.0 基于 Ling-2.0 架构(MoE,100B-A6B)训练,围绕“看得更准、听得更细、生成更稳”三大目标全面优化。视觉方面,融合亿级细粒度数据与难例训练策略,显著提升对近缘动植物、工艺细节和稀有文物等复杂对象的识别能力;音频方面,实现语音、音效、音乐同轨生成,支持自然语言精细控制音色、语速、情绪等参数,并具备零样本音色克隆与定制能力;图像方面,增强复杂编辑的稳定性,支持光影调整、场景替换、人物姿态优化及一键修图等功能,在动态场景中仍保持画面连贯与细节真实。
百灵模型负责人周俊表示,全模态技术的关键在于通过统一架构实现多模态能力的深度融合与高效调用。开源后,开发者可基于同一套框架复用视觉、语音与生成能力,显著降低多模型串联的复杂度与成本。未来,团队将持续优化视频时序理解、复杂图像编辑与长音频生成实时性,完善工具链与评测体系,推动全模态技术在实际业务中规模化落地。
目前,Ming-Flash-Omni 2.0的模型权重、推理代码已在 Hugging Face等开源社区发布。用户也可通过蚂蚁百灵官方平台Ling Studio在线体验与调用。(周小白)
很赞哦!(4)
上一篇: 【华西计算机】0302
相关文章
- 问界依旧是主力 鸿蒙智行2月交付2.8万辆:同比增长31%
- 腾讯元宝追加100张万元现金“小马卡”
- 小米之家免费送 30 万份“超级小爱中国结”,全国上万家门店同步开领
- 小米汽车新春短片《献给汽修工人李尚国》上映,《宇宙探索编辑部》导演孔大山执导
- 德龙激光 2025 年业绩扭亏为盈 营收增 10.04% 新兴领域商业化实现突破
- 陕西一高校团队精准量化血液流变
- 谷歌 Gemini 遭蒸馏攻击:被大量提问内部逻辑,单次行动提示超 10 万次
- 开车过新年|带着“毛孩子”2300公里的回家之旅
- 雷军:小米汽车首场发布会,就明确了安全高于一切的理念
- 奔驰中国宣布人事调整:销售公司总裁兼首席执行官段建军因个人原因离职,李德思接任
热门文章
站长推荐
友情链接
- 欧亿官网下载-加密货币交易APP随时掌控
- 欧亿交易所下载-安全存储交易加密资产
- 欧亿官网版下载-开启安全下载数字资产之旅
- 欧亿-手机电脑端同步,畅享全球交易网络
- 欧亿官网下载-加密货币交易APP随时掌控
- 欧亿交易所官网-坚守标准打造规范使用平台
- 欧亿交易所-全球时区适配,交易顺畅无阻
- 下载欧亿交易所-数字资产交易安全第一步
- 欧亿-社区驱动型平台,引领金融科技新潮流
- 欧亿-机构级资产守护,安全交易第一步
- 下载欧亿官网-安全认证开启交易平台
- 欧亿app下载-数字期货专业市场安全下载
- 欧亿-社区驱动型平台,引领金融科技新潮流
- 欧亿手机版下载-机构级区块链金融基础设施
- 欧亿下载官网-专业风控确保每笔交易安全
- 欧亿-合规运营保障,用户权益全面守护
- 欧亿-保障资金安全,专业交易伙伴首选
- 欧亿-深度订单簿优化,交易价格精准匹配
- 欧亿下载官网-专业风控确保每笔交易安全







