首页 > 科技 > 正文
Qzone
微博
微信

Hume AI发布全球首个具有情商的对话式AI EVI

科技 三易生活网 2024-04-10 09:02

日前,人工智能(AI)初创公司Hume AI发布语音交互的智能聊天机器人EVI(EmpatHic Voice Interface),并号称这是全球首个具有情商的对话式AI,可通过人类用户的声音,包括口音、语气、语调、拟声词、节奏、停顿等,分析理解情绪、心理状况等,并能够以低于700毫秒的延迟做出实时响应。

据了解,EVI是由Hume AI自研的新型多模态大模型“移情大模型”(eLLM)提供支持,目前可检测出53种不同的人类情绪。而移情大模型则基于Hume AI建立,号称是有史以来最大、最多样化的人类情感表达数据库,以及Hume AI创始人、CEO兼首席科学家Alan Cowen在2021年提出的语义空间理论(Semantic Space Theory)开发。

其中,语义空间理论是一种理解情感体验和表达的计算方法,旨在通过广泛的数据收集和统计模型,精准绘制人类情感的全谱图,揭示人类高维本质和情感状态之间的连续性,量化声音、面部和手势的细微差别。

据悉,在移情大模型的支持下,EVI不仅可以识别用户的情绪、根据用户情绪以类似人类的语调作出回应,还可以通过分析用户的语气,判断当前话题是否结束,以避免与用户同时说话的尴尬。而且EVI的发言可以像人类谈话一样被打断,并且其能从中断点恢复对话。

据了解,目前EVI有两个版本。其一是较早发布的Demo演示版,其页面布局十分简洁,用户点击页面中央的“开始对话”按钮,就能直接与EVI进行语音对话。对话过程中,页面中央为声音波形图,右侧则会实时地将语音交互内容转写成文字,作为历史对话展示出来。同时不论是用户的主动发问、还是EVI生成的回答,下方都将显示一个情感分析柱状图,标注对应话语中所蕴含的感情成分。

另一个版本则是最新发布的beta版,其加入了更多功能,包括支持用户使用文字进行交互,以及保存并下载对话历史记录。此外beta版EVI还支持用户设定性格,例如“充满了渴望的电冰箱”、“容易嫉妒的室内绿植”等。

对于EVI的未来及商业化方向,据Alan Cowen透露,比起直接面向普通用户的to C服务,该公司更倾向于为其他企业提供API接口,即在一个能理解人类情感的模型的基础上,再构建细分领域的聊天机器人,如信息检索、数字陪伴、工作协助、医疗保健、xR等等。

此外Alan Cowen认为,AI需要情商、并且其互动界面的未来将是基于语音的。对此他表示,“当前AI系统的主要局限性在于,它们受到肤浅的人类评级和指令的指导,这些评级和指令容易出错,无法利用自身的巨大潜力来提出让人们快乐的新方法。通过构建直接从人类幸福的代理中学习的AI,我们有效地教它从第一性原理重建人类的偏好,然后用它与它交谈的每一个新人和它嵌入的每个新应用程序来更新这些知识”,以及“AI界面的未来将是基于语音的,因为语音比打字快四倍,携带的信息量也是打字的两倍,但为了充分利用这一点,你真的需要一个更多地捕捉不仅仅是语言的对话界面”。

【以上内容转自“三易生活网”,不代表本网站观点。如需转载请取得三易生活网许可,如有侵权请联系删除。】

 

延伸阅读:

 

责任编辑: cxr4186

责任编辑: cxr4186
人家也是有底线的啦~
广告
Copyright © 2018 TOM.COM Corporation, All Rights Reserved 雷霆万钧版权声明
违法信息/未成年人举报:010-85181169     举报邮箱/未成年人举报:jubao@tomonline-inc.com