Loading… 小米AI生态又添一员!机器听觉解决方案提供商大象声科获Pre-A轮融资_TOM科技
正文
Qzone
微博
微信
小米AI生态又添一员!机器听觉解决方案提供商大象声科获Pre-A轮融资
2018-07-10 13:44 亿欧网   

 

近日,机器听觉解决方案供应商大象声科(Elevoc)宣布获得小米和高通创投的数千万人民币的Pre-A轮战略投资。挚金资本担任本轮融资的独家财务顾问。大象声科表示,该轮融资具有广泛重要的战略意义,将有利于强化上下游产业链,进一步赋能通讯、智能家居、智能车载、可穿戴设备、安防等行业客户。

大象声科是一家语音信号处理引擎提供商,2015年创立于美国硅谷,目前总部位于深圳。公司汇聚了以俄亥俄州立大学国际著名学者、IEEE Fellow汪德亮教授为代表的人工智能语音交互领域优秀的科学家团队,依托算法、软件、硬件三个维度的技术纵深,为语音增强智能语音交互提供解决方案。语音增强技术,深度学习驱动。

语音增强,本质就是语音降噪。在收录声音时,往往被嘈杂的环境背景声所“污染”,语音增强可以从噪音中提取有效的声音信号,恢复“干净”的语音。

语音增强涉及的应用领域非常广泛,包括语音通话、电话会议、现场录音、军事通信、助听器设备和语音识别设备等,并成为许多语音编码和识别系统的预处理模块。

提到语音增强技术,就不得不提出计算机语音识别领域注明的“鸡尾酒会问题”。“鸡尾酒会问题”指在如鸡尾酒会嘈杂的环境下的强干扰下,辨识出一种声音难度是很高的,语音识别率极低。如何在混合信号中识别出每个人的独立信号成了技术难题。

深度学习语音增强技术是该领域的新起之秀,却有攻入破竹之势。不同于主流而传统的数字信号处理方法,它借鉴机器学习的思路,通过有监督的训练实现语音增强,可以解决瞬时降噪等技术难题。华为今年发布的mate10手机,已成功地将该技术应用到了复杂声学环境中的语音通话中。而今年4月,刷遍朋友圈的锤子手机新品坚果3采用的AI语音降噪技术,就是来自大象声科的深度学习语音提取技术。

目前,大象声科已经成功推出了全球首款芯片级单通道人工智能语音增强方案,在不依赖物理硬件的情况下,有效实现了噪音和人声的分离,并在手机通讯行业率先进行了商用,开启了人类无噪音通讯时代。此外,大象声科将单通道语音增强技术与麦克风阵列结合,将多通道语音增强的性能也提升到新台阶,真正解决了语音前端处理的技术难点。应用场景有智能手机、对讲机、耳机、麦克风、在线教育平台、网络视频会议、语音客服等。为机器人打造智能耳朵的生意,资本看好

小米首席架构师、人工智能与云平台副总裁崔宝秋表示:“智能语音已经成了新一代人机交互入口的必争之地,鉴于AI在语音以及其他领域的深度应用,我们将AI定为小米未来十年最重要的战略之一。大象声科的技术团队基于多年对计算听觉场景分析的研究和积累,创造性地采用深度学习技术解决听觉领域中著名的“鸡尾酒会问题”,拥有全球领先的核心算法。我相信小米与大象声科的合作,一定会为小米以及小米生态链下一代系列智能语音产品带来更精彩的人机交互体验。”

高通全球副总裁兼高通创投董事总经理沈劲表示,“人工智能正在从云端向终端迁移,高通作为技术提供商,一直在积极地关注并加速在终端侧人工智能的布局,大象声科拥有业界领先的语音增强和智能语音交互解决方案,势必会让更多的终端设备受益于人工智能技术,加快终端智能化生态的发展。”

大象声科创始人兼CEO苗健彰表示:“ 虽然人工智能技术的发展已经取得了长足进步,但是要实现人性化的的语音交互还有许多关键问题有待解决,机器听觉就是其中之一。自创立伊始,大象声科便树立了为机器人打造智能耳朵的目标。大象声科在机器听觉理论研究上一直走在世界前沿,联合创始人汪德亮教授和张学良教授在该领域有超过20年的技术积累。特别是汪教授不仅是机器听觉领域的重要理论——计算听觉场景分析(CASA)的奠基人之一,还是全球第一位将深度学习应用于语音增强的学界泰斗。”

下一步,大象声科将依托自身行业领先的技术优势,整合小米和高通创投的战略资源,联合通讯、智能硬件、安防等领域的优质客户,共同将高品质和便利的人工智能服务带进千家万户。

据了解,2018年中国智能硬件市场规模预计将突破4000亿元,全球语音产业规模预计也将突破100亿美元,语音产业结构将顺延硬件产品、AI软件、语音应用Apps、生态系统服务相结合的架构继续高速发展。语音交互将成为主流的人机交互方式之一,音讯处理的需求也将快速扩张。

责任编辑: 3966KJH TS006
责任编辑: 3966KJH TS006
广告