近日科大讯飞方面宣布对星火语音大模型进行更新,正式推出星火极速超拟人交互功能。据悉,星火极速超拟人交互功能计划于本月底在讯飞星火App上线,届时所有用户均可体验。
据了解,星火极速超拟人交互功能采用统一神经网络,可实现语音到语音的端到端建模,简化了传统语音得交互流程,从而缩短响应时间、提升交互的拟人度和流畅度。此外,通过多维度的语音属性解耦表征训练,还可灵活控制多种元素,从而满足不同的场景和需求。
科大讯飞方面透露,星火极速超拟人交互功能在响应和打断速度、情绪感知和情感共鸣、语音可控表达、人设扮演4个方面实现突破。具体而言,在响应和打断速度方面,其已支持多轮交互,且与GPT-4o速度相当,几乎介意与人类的正常聊天节奏保持一致,即使对话被频繁打断也能迅速反应、生成符合日常情境的对话。
在情绪感知和情感共鸣方面,该功能可识别用户包括喜、怒、哀、乐等多种情绪,能通过声音内容对情绪进行判断,再以适当的情感回应,同时还能识别咳嗽、宠物叫声等非言语声音,并给出相应回应。
而在语音可控表达方面,与以往不同,现在用户只需语音发出指令,便可控制星火极速超拟人互动在情感、风格、方言等表达方式上进行改变。此外在人设扮演方面,星火极速超拟人交互功能可支持多角色模拟,并根据用户需求来变换不同角色,以增强趣味性和互动性。
对此官方表示,星火极速超拟人交互功能全面开放使用后,计划在未来持续拓展交互功能和模态,为用户提供更丰富、实用的智能语音服务。
不久前科大讯飞方面曾宣布,正式发布智能文档产品讯飞智文2.0。据了解,讯飞智文2.0版本基于讯飞星火V4.0大模型打造,并引入了全新升级的PPT文本生成大模型、AI PPT编排创作引擎,以及AI PPT在线编辑模组。
【以上内容转自“三易生活网”,不代表本网站观点。如需转载请取得三易生活网许可,如有侵权请联系删除。】
延伸阅读: