Facebook新AI模型实现图片监测，微美全息光场视觉AI模块化拼接算法优秀

科技爱云资讯 2021-03-21 09:27

伴随着深度学习技术的突破,人工智能开始以前所未有的速度在全球范围内快速发展,中国的人工智能技术与实际应用更是走在了世界的前列,并已经在工业的各个领域落地结果。即AI算法为代码,基于数学原生表达的AI编程新范式,打造易用、高效、易调试的可微编程架构,降低开发门槛,让算法专家聚焦AI创新和探索。

目前,计算机视觉是深度学习最热门的研究领域之一。它位于许多学术科目的交汇点,如计算机科学(图形学、算法、理论、系统、体系结构),数学(信息检索、机器学习),工程学(机器人、语音、自然语言处理、图像处理),物理学(光学),生物学(神经科学)和心理学(认知科学)。由于计算机视觉代表了对视觉环境及其背景的相对理解,许多科学家认为,该领域因为其跨域掌握为人工智能铺平了道路。

当下AI计算机视觉应用无处不在,包自动驾驶汽车、智能手机、监控摄像头、消费类摄像头、AR/VR、机器人和工业应用等等。尽管各行各业都在加快对于人工智能产品的布局和开发,但拥有人工智能的核心技术,才是实现高质量的产品应用开发的关键。

获取训练数据是人工智能领域最大的竞争优势之一,通过收集数百万、上千万用户的这一资源,Facebook、谷歌和亚马逊等科技巨头已经能够在各个领域取得领先优势。

该公司在官方博客中写道:“通过学习横跨多个国家数百种语言的全球公开视频流,我们的人工智能系统将不仅提高准确性,而且还将适应我们快速移动的世界,并识别不同文化和地区的细微差别和视觉线索”。

Facebook表示,由此产生的机器学习模型将用于创建新的内容推荐系统和节制工具,但未来还可以做得更多。当然,Facebook已经可以通过目前的广告定向业务获得此类信息,但如果能够通过人工智能解析视频,将为其商店增加一个令人难以置信的丰富(和侵入性)数据来源。

近日,Facebook公司分享了两个内部人工智能项目的细节,分别是Learning from video和TimeSformer,这两个项目旨在促进更强大的机器学习模型的开发。

其中第一个项目“通过视频学习”(Learning from video),Facebook公司将通过用户上传的视频来训练驱动其社交网络的机器学习系统。

Facebook正在使用一种 “自监督学习”的方法,更好地使用用户视频训练模型,这种方法是不需要对训练数据打标签的。

该模型被称为SEER(SElf-SupERvised),被馈入了10亿张公开可用的Instagram图像,这些图像未经过手动标记。但是,即使没有通常在AI算法训练中使用的标签和注释,SEER仍能够自主地训练数据集,不断进行学习,并最终在诸如对象检测之类的任务上达到最高的准确性。

这种被称为自监督学习(self-supervised learning)的方法在AI领域已经很成熟:它由可以直接从给定信息中学习的系统组成,而不必依赖经过仔细标记的数据集来教他们如何执行诸如识别照片中的对象或翻译文本之类的任务。

自监督式学习近来引起了很多关注,因为这意味着需要手工标记数据的工作要少很得,这对大多数研究人员而言是费时费力的工作。无需管理数据集的同时,自监督模型可以处理更大,更多样化的数据集。

在某些领域,特别是自然语言处理中,该方法已经取得了突破。在数量越来越多的未标记文本上训练算法已使诸如问答、机器翻译、自然语言推理等应用程序取得了进展。

当前,人工智能作为引领未来的战略性技术,已成为全球竞争新高地。人工智能已成为我国科技发展的首要聚焦方向,要加快其发展进程,背后需获取充足的AI算力支持。

近年来,中国对人工智能的投资呈现快速增长的态势,以超大规模的互联网公司和大型行业用户为首,企业纷纷加大对人工智能的投资,来满足日益增长的AI创新对于算力的需求,并寻求企业的数字化转型和中国整体产业变革和升级。

以计算机AI视觉为代表的微美全息,微美的计算机视觉全息云服务其商业应用场景主要聚集在家用娱乐、光场影院、演艺系统、商业发布系统及广告展示系统等五大专业领域,已经布局到智慧城市的相对应领域。微美全息(WiMi)专注于全息云服务,主要聚集在车载AR全息HUD、3D全息脉冲LiDAR、头戴光场全息设备、全息半导体、全息云软件、全息汽车导航等专业领域,覆盖从全息车载AR技术、3D全息脉冲LiDAR技术、全息视觉半导体技术、全息软件开发、全息AR广告技术、全息AR娱乐技术、全息ARSDK支付、互动全息通讯等全息AR技术的多个环节,是一家全息云综合技术方案提供商。

微美全息以“眼界即视界”为使命,公司建立了全球顶级、自主研发的深度学习平台和超算中心,并且研发了一系列AI技术,包括:人脸识别、图像识别、文本识别、医疗影像识别、视频分析、无人驾驶和遥感等。全息3D人脸识别软件的开发基于微美的全息成像特征成像检测和识别技术、模板匹配全息成像检测技术,以及基于深度学习和训练的视频处理和识别技术。传统的2D面部识别技术是一种基于面部特征的识别技术,它从面部图像或面部视频流中捕获信息,并自动检测和跟踪目标面部;微美的全息3D面部识别技术是全息成像捕捉和3D肖像的结合的识别技术。

全息面部变化技术基于全息3D图层替换技术,包括基于AI的图像识别和动态融合处理技术,实时跟踪图像以及用其他面部替换面部。该技术取代视频帧中的人脸,合成视频并添加原始音频。微美已经在全息AR插件广告应用中验证了这些技术模块,并将继续开发和升级这些技术模块。微美相信这项技术将为名人广告,电影发行和直播视频流等应用带来新的业务增长。

微美领先的全息AR内容制作功能围绕图像采集、对象识别、自动图像处理和计算机视觉技术而构建。微美的软件工程团队和可视化设计团队紧密合作,不断推进这些可视化相关技术,并利用它们设计和生产创新的全息AR内容。通过提供精确姿态估计的实时计算机视觉算法,能够在几秒钟内执行场景识别和跟踪。这种尖端算法还允许微美以像素为基础执行照片级真实高分辨率渲染的可视化。Frost&Sullivan表示,虽然大多数同行公司可能会识别并捕获特定空间单位内的40到50块图像数据,微美可以收集的数据块数量达到500到550;微美的图像处理速度比行业平均水平提高了80%,从而提高了运营效率。在场景重建过程中,微美的自动图像处理工具可以对最初拍摄的图像进行噪声清除和特征增强,从而能够创建具有业界领先模拟度的同类最佳全息AR设计。

2020年,中国人工智能服务器占全球人工智能服务器市场的三分之一左右,成为全球人工智能产业发展的中坚力量。

2020年,面向日益增长的算力需求浪潮前瞻地提出“智算中心”,通过公共算力新型基础设施来提供人工智能应用所需算力服务、数据服务和算法服务,以承载AI技术创新,促进数据开放共享,加速智能生态建设,带动智能产业的聚合。

近日,国际数据公司发布2020H1《全球人工智能市场半年度追踪报告》,报告显示,2020上半年全球人工智能服务器市场规模达到55.9亿美元,占人工智能基础设施市场的84.2%以上,成为AI基础设施的需求主体。

过去一年,人工智能在行业的应用获得了快速发展,通用型应用场景已经具有相当的成熟度,在业务需求的推动下,具有高行业属性的碎片化应用也开始被广泛使用,并辐射到了媒体娱乐、现代农业、智能家居、智慧电力等多个不同领域。

目前,人工智能所需算力每两个月即翻一倍,承载AI的新型算力基础设施的供给水平,将直接影响AI创新迭代及产业AI应用落地。