首页 > 科技 > 正文
Qzone
微博
微信

腾讯混元大模型迎来升级,正式开放文生图功能

科技 三易生活网 2023-10-30 08:56

日前,腾讯方面宣布腾讯混元大模型迎来升级,并正式开放“文生图”功能。据官方透露,升级后的腾讯混元中文能力整体超过ChatGPT3.5,其代码能力大幅提升20%、达到业界领先水平。腾讯混元大模型文生图技术负责人芦清林对此表示,腾讯文生图从去年8月份开始着手,最早在广告场景进行探索,今年被作为重点项目正式大力度投入,现正在探索生成3D和视频的形式。

据悉,文生图是AIGC领域的核心技术之一,对模型算法、训练平台、算力设施较高的要求。针对语义理解、内容合理性,以及画面质感这三个技术难点,腾讯方面也均进行了优化。其中在语义理解方面,腾讯混元采用中英文双语细粒度模型,通过同时建模中英文实现双语理解,并通过优化算法提升了模型对细节的感知能力与生成效果。在内容合理性方面,混元文生图通过增强算法模型的图像二维空间位置感知能力,让生成的图像结构更合理,减少错误率。而在画面质感方面,混元文生图则是基于多模型融合的方法,来提升生成质感。

芦清林表示,腾讯混元的文生图应用的特点是更在意真实与美的统一,因此经过模型算法的优化之后,混元文生图的人像模型,包含发丝、皱纹等细节的效果提升了30%,场景模型包含草木、波纹等细节的效果提升了25%。据悉,目前腾讯混元文生图能力已经被用于素材创作、商品合成、游戏出图等多项业务中,在多轮测评中,其案例优秀率和广告主采纳率分别达到了86%和26%。

在商业化方面,芦清林表示其体量“非常大”,而且未来不会仅面向广告业务,后续还会面向其他业务开放。目前腾讯内部已有多个开发平台接入了腾讯混元大模型,有超过180个内部业务接入,包括腾讯会议、腾讯文档、企业微信、腾讯广告和微信搜一搜等。对此芦清林强调,腾讯其他产品团队是从产品的视角考虑用户更需要什么,并提出技术方面的需求,混元再来配合。

公开资料显示,混元大语言模型于9月7日在2023腾讯全球数字生态大会上正式亮相,并宣布通过腾讯云对外开放,其具备中文创作能力,复杂语境下的逻辑推理能力,以及可靠的任务执行能力。值得注意的是,其拥有超千亿参数规模,预训练语料超2万亿tokens,当时已经接入腾讯50多个业务并取得初步效果,包括腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档、微信搜一搜、QQ浏览器等业务和产品。

【以上内容转自“三易生活网”,不代表本网站观点。如需转载请取得三易生活网许可,如有侵权请联系删除。】

 

延伸阅读:

 

责任编辑: cxr4186

责任编辑: cxr4186
人家也是有底线的啦~
广告
Copyright © 2018 TOM.COM Corporation, All Rights Reserved 雷霆万钧版权声明
违法信息/未成年人举报:010-85181169     举报邮箱/未成年人举报:jubao@tomonline-inc.com