首页 > 科技 > 正文
Qzone
微博
微信

天工3.0基座大模型与天工SkyMusic大模型开启公测

科技 三易生活网 2024-04-20 10:00

正值天工大模型发布一周年之际,4月17日昆仑万维方面宣布,天工3.0基座大模型与天工SkyMusic音乐大模型正式开启公测。

据了解,与天工2.0相比,天工3.0拥有4000亿参数,超越了3140亿参数的Grok-1,是全球参数最大、性能最强的开源MoE大模型,在语义理解、逻辑推理、通用性、泛化性、不确定性知识、学习能力等领域拥有突破性的性能提升,数学/推理/代码/文创能力均提升超过30%。而在MMBench等多项权威多模态测评结果中,天工3.0超越GPT-4V,达到全球领先水平。

值得一提的是,天工3.0新增了多轮搜索与综合工具调用、图表绘制、研究模式、增强模式、改图扩图等多项AI能力,可为用户带来全新AI体验。以多轮搜索与综合工具调用为例,天工3.0针对模型独立规划、调用、组合外部工具及整合信息的能力进行了专项训练,使其能够独立生成并调用代码,完成包括产业研究、产品横评、信息分析、图片生成、图表绘制等多种复杂用户需求。同时天工3.0能够通过强大的语义理解能力将用户任务拆解成细分环节,实时判断是否需要联网或调用工具,进行单轮或多轮的联网搜索、工具调用,完成包括多轮搜索、热点信息分析、图片生成等复杂用户需求。

而天工SkyMusic是国内首个公开可用的AI音乐生成模型,更是国内自研大模型相关技术第一次在AIGC领域领跑全球。据了解,与当下AI音乐行业普遍选择符号音乐生成技术路线不同,天工SkyMusic采用自研大模型音乐音频生成技术路线,直接通过大模型技术实现乐器、人声、旋律、音量、音符的一体化端到端音乐生成,对此昆仑万维方面表示,“(这一路径)技术难度极大,全球只有包括昆仑万维在内的极少数顶尖玩家参与”。

据悉,在与海外顶尖的AI音乐大模型Suno V3的横向测评中,天工SkyMusic在人声&BGM音质、人声自然度、发音可懂度等领域显着领先对手,并以6.65分的综合得分超越Suno V3,成为全球AI音乐SOTA模型。值得一提的是,天工SkyMusic还拥有独创的参考音乐生成与方言歌曲生成能力。

其中,参考音乐生成能力是指用户可上传自有参考音乐,或选择天工SkyMusic资料库中现有的参考音乐,从而生成风格、唱腔类似的歌曲,进一步降低音乐大模型的使用门槛,让不熟悉乐理知识的用户也能轻松玩转。而在方言歌曲生成方面,天工SkyMusic目前已支持粤语、成都话、北京话等多种方言。

【以上内容转自“三易生活网”,不代表本网站观点。如需转载请取得三易生活网许可,如有侵权请联系删除。】

 

延伸阅读:

 

责任编辑: 吉熟

责任编辑: 吉熟
人家也是有底线的啦~
广告
Copyright © 2018 TOM.COM Corporation, All Rights Reserved 雷霆万钧版权声明
违法信息/未成年人举报:010-85181169     举报邮箱/未成年人举报:jubao@tomonline-inc.com