中证网讯(记者 任明杰)3月22日,在阿里人工智能实验室2018年春季发布会上,阿里推出了AliGenie开发者平台的2.0版本。相对于AliGenie 1.0,AliGenie2.0进行了全面升级,在“听”和“说”的基础上引入视觉能力,能够进行视觉认知、多模态交互、情景感知。
其中,AliGenie 2.0的视觉认知能力包括图像识别、人脸识别、物体检测;AliGenie 2.0的多模态交互能力可以通过对语音、图像、触摸等多种交互形态的融合,模拟人与人之间的交流方式;AliGenie2.0的情景感知能力,则基于你所在的上下文、对话场景自主学习,深刻理解情景需求。这一升级将重新定义机器和人的交互方式,让机器和人的交流更像是人与人之间的交流。
而AliGenie 2.0的视觉能力包括图像识别、物体检测、人脸识别。AliGenie 2.0首先将视觉能力落地在智能音箱天猫精灵X1,通过搭载在天猫精灵手机APP的“精灵火眼”功能,以及天猫精灵XHolder,天猫精灵在几乎没有增加硬件设备成本的情况下,具备视觉识别能力。目前精灵火眼能识别117套图书、4万个药盒。未来将推出“万物识别”、“人脸识别”等功能。
据介绍,“精灵火眼”的核心能力有两个:“视觉认知”和“表情系统”。
在视觉认知方面,精灵火眼通过图像识别,结合智能语音互动、声音朗读,帮助儿童读书、识字,还针对老年人视力不佳的问题,开发了识别药盒的功能,与阿里健康合作,能够识别4万种药盒,覆盖中国家庭常用药,只要用精灵火眼扫一扫药盒,就能用语音播报药名、功效、过期日等信息。
在表情系统方面,精灵火眼提供了一个全新视觉系统,基于3D虚拟形象,提供自然交互的表情拟态动画,目前包括近20多种拟态动画,触摸虚拟形象的不同部位,能够产生反馈和互动,使用户体验从天猫精灵的语音交互升级为“精灵火眼”的自然互动。
阿里方面表示,2018年,AliGenie 2.0版本将主要在儿童教育、游戏、动画、养老、IoT等领域进行重点扩展,还将在家庭、新零售等领域展开AliGenie 2.0版本的相关合作和生态扩展。AliGenie目前的合作伙伴覆盖航空、养老、儿童教育、酒店、汽车、家电、影音等领域,近100个品牌。在AliGenie 2.0阶段,迎来了在家电行业与LG、博世的合作。同时,在汽车行业,也开始了与沃尔沃、宝马、奔驰的合作探讨。
随着AliGenie 2.0的发布,阿里在人工智能领域的布局将进一步加快。以阿里推出的智能音箱天猫精灵为例,截止到今年3月,天猫精灵累计销量达200万台。去年双11,天猫精灵更是创下了单日100万的销量,也成为唯一一款销量超过100万的中文智能音箱产品。而在全球市场,最畅销的智能音箱亚马逊ECHO达到这一数字,用了一年多的时间。
“A.I.Labs是阿里巴巴集团专注于消费级人工智能产品的研发机构,部门的使命是探索创新的人机交互方式,天猫精灵只是一个开端。在推出这款产品的时候我们说过,我们选择自己做硬件是为了把产业链完整的走一遍,才能知道真正的市场需求。最终我们希望将AliGenie 这套人机交互系统开放出去,赋能合作伙伴和开发者。”阿里相关负责人表示。