首页 > 科技 > 正文
Qzone
微博
微信

字节跳动文生图开放模型发布,号称速度加快十倍

科技 三易生活网 2024-02-27 09:01

日前有消息显示,字节跳动方面发布文生图开放模型SDXL-Lightning。据悉,该模型已在AI开源社区Hugging Face公开,并跻身模型趋势榜,而一同上榜的则是谷歌新近推出的“最强开放大模型”Gemma系列,以及Stability AI的新一代文生图模型Stable Cascade。

据知情人士透露,SDXL-Lightning通过渐进式对抗蒸馏的技术,能够在2步或4步内生成极高质量和分辨率的图像,号称可以将生成速度加快十倍,同时是目前1024分辨率下速度最快的文生图模型,计算成本降低为十分之一。在当前文生图领域,主流模型的生成技术依赖于扩散过程,即通过多次迭代将噪声逐渐转化为图像,这一过程通常需要20-40次调用神经网络,存在着计算资源消耗大、生成速度慢的缺点,生成一张高质量图像需要约5秒。

字节跳动智能创作团队表示,SDXL-Lightning是基于开源文生图模型SDXL的改进版本,设计之初就考虑到与开放模型社区的兼容,支持其他工具和插件。其可以作为增速插件无缝整合到卡通、动漫等多样风格的SDXL模型中,并支持当前流行的控制插件ControlNet、生成软件ComfyUI,方便开发者、研究人员和创意从业者结合使用这些工具,助力整个行业的创新和协作。

对此有业内人士表示,对于要快速图像生成的应用场景,如实时广告创意、游戏角色设计等,SDXL-Lightning模型拥有一定潜力,这项技术也可以被运用于快速且高质量生成视频、音频以及其他多模态内容。

此外有消息源曾透露,在OpenAI发布旗下视频生成模型Sora之前,字节跳动方面就推出了一款“颠覆性视频模型”Boximator。消息显示其可以通过文本精准控制生成视频中人物或物体的动作,这是与既有的Gen-2、Pink1.0等模型最大不同区别之处。但字节跳动方面相关人士随后表示,“Boximator是视频生成领域控制对象运动的技术方法研究项目,目前还无法作为完善的产品落地,距离国外领先的视频生成模型在画面质量、保真率、视频时长等方面还有很大差距”。

目前,字节跳动方面的一站式AI Bot(AI聊天机器人)开发平台扣子(Coze)也已正式在国内市场上线。该平台支持30秒无代码生成AI Bot,快速搭建基于AI模型的各类问答Bot,从解决简单的问答到处理复杂逻辑的对话。同时,扣子还具备无限拓展的能力集、丰富的数据源、持久化的记忆能力,以及灵活的工作流设计等优势。

在内置插件方面,扣子目前已集成了超过60种不同的插件,覆盖新闻阅读、旅行规划、生产力工具等多个领域。在创建完成后,扣子还支持用户将所创建的AI Bot一键发布到飞书、微信公众号、豆包等渠道。此外,扣子还推出了类似GPT Store的Bots商店,用以集合和分发用户创建的各类AI Bot,并同样设有分类排行榜等。

【以上内容转自“三易生活网”,不代表本网站观点。如需转载请取得三易生活网许可,如有侵权请联系删除。】

 

延伸阅读:

 

责任编辑: cxr4186

责任编辑: cxr4186
人家也是有底线的啦~
广告
Copyright © 2018 TOM.COM Corporation, All Rights Reserved 雷霆万钧版权声明
违法信息/未成年人举报:010-85181169     举报邮箱/未成年人举报:jubao@tomonline-inc.com