盛视科技:AI落地应用的痛点,可用两招化解!
【CPS中安网 cps.com.cn】 2021年12月26日,第十八届中国国际社会公共安全博览会在深圳举行,同期举办的还有由CPSE安博会、深圳市安全防范行业协会共同主办,CPS中安网承办,希捷科技冠名的第十六届中国安防论坛之管理论坛。
在论坛上,盛视科技新技术研究院算法总监欧阳一村博士带来以《立足AI行业应用,增强模型泛化能力和提升边端移植精度》为主题的演讲,分享AI如何走向更广的市场、AI落地中的痛点、技术方案。
盛视科技新技术研究院算法总监 欧阳一村 博士
分享主题《立足AI行业应用,增强模型泛化能力和提升边端移植精度》
欧阳一村表示,如今AI赋能各行各业的趋势越来越深入,但在行业落地的时候依旧面临着各种难点和痛点,模型的泛化能力差和边端移植精度低,困扰安防行业向高尖端领域快速推进。
未来,在数智化时代的背景下,安防想要更好的服务于社会各领域,推动安防高质量发展,需要增强模型泛化能力和边端移植精度,提升用户体验感。
在演讲中,欧阳一村结合一些盛视科技落地的案例,详细介绍如何把AI技术和行业进行结合。
01
盛视科技深耕技术25年
欧阳一村介绍,盛视科技成立于1997年,成立之初当时的logo是Max Vision,代表的是盛视科技一直以图像和处理为核心,从模拟信号传输到图象处理以及之后的计算机视觉。
一直以来,盛视科技不断迭代视觉技术,从模拟信号到数字信号的升级,以及从早期的传统机器学习到现在最新的深度学习,一直以来都专注于技术的更新迭代。
1999年,深圳市皇岗口岸开通了第一条车辆快捷通道,司机不用下车就能完成快速通关。
整体的流程是,首先当车开到通道之前,视觉技术会对车辆的车牌以及RFIC等备案信息进行读取,司机到升降机前不用下车,对他的人脸和指纹进行相应身份认证,所有手续通过之后就可以完成整个通关流程,所以非常便捷。
2005年,在罗湖口岸,开启了第一条旅客自助查验通道,疫情之前每天通关量是30万以上,这么大的通关量需要自助验证手段,所以2005年开通了第一条,旅客进入通道,在第二道门之前,会对旅客的身份以及人脸和指纹信息进行验证,验证之后门开启,完成整个通关流程。因为通关量巨大,开启了这个技术之后,极大地加速了通关过程。
AI技术中,除了人脸和指纹识别,还应用了多项AI技术。比如车辆通关的时候,我们要防止车底的偷渡行为,要进行扫描,同时涉及到的是多国车辆,所以需要对各个国家的车牌进行识别。
在旅客通道,在对出入证读取的时候,不仅仅是常用的普通护照,还有港澳台通行证等等,所以针对各种各样的出入证件都要进行精准识别。
同时在通道内容易产生尾随,需要对尾随进行精准识别。传统手段更多是红外对射的方法,但是误识率比较高,所以盛视科技引入了视频识别的方法,对包括拖拉行李等各种行为进行精准分类定位,通过引入这种新技术以后,误识率从原来的3%降到万分之一以下。
2010年到2015年期间,盛视科技重点研发了海港系列的产品,海港相对于室内场景,存在环境大、布线困难、容易受到强光、风和噪声等各方面影响。
比如常用的人脸识别、指纹识别不好用,因为强光照射之下,2015年之前对成像和识别率没有太好的方法,很难成像,更别提识别率。
海港作业的工人指纹也有所磨损,指纹识别也不好用,盛视科技引入了虹膜识别和指静脉识别,就比较好地解决了这个问题,保证比较高的识别率。
同时,因为海港的场景比较大,盛视科技开发了移动的产品,也就是当靠近海港的时候,移动设备可以部署在船的四周,对上下梯口、规避验证等行为进行分析,可以保证海港安全。
在2012年,盛视科技在武汉成立了研发中心,同时也和华中科技大学合作,成立了人工智能联合实验室,在AI方面不断加大投入。
2018年,在上海虹桥机场,我们引入了上图这台X光机,它除了能够判断危险物品之外,还能对动植物进行检测,同时针对有风险的行李、包裹进行标定,在行李的主人来取行李的时候,能把他的人和物进行绑定。
通过这种方式,可以在海关查验处进行拦截。同时也把声音技术应用到了集装箱的空箱,因为海港是比较宽的范围,空箱检测容易受到噪声影响,盛视科技利用优化过的声音技术对空箱技术检测。
这么多年来,盛视科技也承接了多项市里、省里各级政府部门的科研攻关项目,成立了广东省智慧口岸工程技术研究中心,也获得了广东省和深圳市的科技进步奖,于2019年5月在A股主板上市。
目前盛视科技的AI技术覆盖的口岸超过300个,这些口岸包括全国所有的口岸以及大中型机场,还有部分欧洲和中东市场,目前为止累计服务的旅客超过80亿人次。
一直以来,盛视科技不断更新迭代和改革旅客查证技术,就是为了有朝一日,在全国范围内能够实现自助出行。
一直以为,盛视致力于AI技术的落地,而且把它很好地应用到国门领域。未来,盛视科技希望能够把积累了这么多年的AI国门技术,引入其他的领域,造福全社会。
因此,盛视科技在去年成立了新技术研究院,也和香港中文大学(深圳)以及深圳市人工智能与机器人研究院合作,成立了人工智能联合实验室。
同时,还成立了智慧系统事业部,希望能够把AI在口岸领域的技术推广到其他部门,其他场景,比如像机场、物流、城市管理等等。
盛视科技开发了多项产品系列,比如说视频盒子为代表的边端计算系列,还有文字识别系列以及以人脸识别、指纹识别等一系列为代表的生物识别系列。
除了通用型产品,盛视科技还把AI技术和垂直领域的行业进行结合,其中有驾驶领域,对司机的特殊驾驶行为进行识别,比如司机开车的时候看手机、瞌睡、打哈欠等等进行相应告警。
同时在环卫领域,AI技术与城市管理领域结合,能够对暴露垃圾、垃圾分类进行识别告警,把相应的信息通过短信形式发给网格员进行监控。
02
AI落地的两大痛点
欧阳一村认为,AI发展多年,但是在具体的行业落地的时候,还存在着瓶颈,主要是两个点:第一是模型泛化能力差,第二是边端算法精度低。
首先,模型泛化能力,近些年来,机器学习依赖于数据获取,在训练数报据上,模型表现比较好,但是当拿到真正应用的环境中,可能目标发生了变化,比如说大小、颜色、角度等等,甚至是它的背景、应用的场景发生了变化,这时候模型表现能力发生比较大的下降,盛视科技称之为模型的泛化能力差。
因为训练模型很多情况下是在GPU端实现,GPU的成本比较高,同时因为考虑到网络传输的带宽问题,以及在某些场景下可能根本没有网络,所以现有情况下,很多模型都需要移植到前端,比如说芯片、摄像头等等,利用压缩的方法,比如量化,算法的精度就会下降得比较多,达不到原来的精度。
上图左侧的垃圾桶数据,这是从公开渠道收集到的图片,把它训练之后拿到右边实际用的场景,对比可以发现,左边垃圾筒的大小、颜色、形状甚至摄像头部署的角度都跟右边不同,所以应用的时候发现左边训练到的模型拿到右边的场景,应用效果比较差。
第二个场景是做城市管理,对出进店行为进行识别,上图左边这种是网上公开可以收集到的图片,是在白天光线条件比较好,拍摄比较清晰的图片。
在训练得到的模型之后,拿到右边实际应用的场景,你会发现右边这张图是拍摄于凌晨1点多,光线是比较差的,因为是夜间,有些拍摄比较模糊,这种情况下,识别九率就会发生比较大的下降。
除了模型泛化能力之外,另一方面是移植的时候出现算法精度。
这五个通用模型,VGG、Mobilenet等等,橙色是移植前的精度,蓝色是量化过后的,可以看到是有比较大的精度损失。
03
两招化解AI应用痛点
针对这两个痛点,盛视科技提出了两个研究方向:一个是数据火山计划,一个是模型鲁班计划。
数据火山计划是从数据角度出发,虽然训练只能得到部分数据,是否能用传统方法和深度学习的方法,比如边缘等等,去生成大量需要的数据呢?比如没有形状、大小、颜色,我能不能生成这样的?模拟不同的场景?
这个计划在一些场景上得到了验证,刚才提到的垃圾筒,就解决了这方面的问题。
模型鲁班计划,可以分为两块,第一,泛化能力除了数据之外,还有模型本身;第二是为了解决移植的时候发生精度丢失,使用一些比较通用的方法,比如压缩的方法,比如量化,会根据项目进行产品调整,尽量使用少的参数量,能够达到尽可能高的模型精度。
欧阳一村最后提到,不管是数据火山计划还是模型鲁班计划,最终都是为了解决AI落地的问题,使得真正的AI技术能够在生活中用起来,改变每个人的生活和工作。
声明:
凡文章来源标注为"CPS中安网"的文章版权均为本站所有,如需转载请务必注明出处为"CPS中安网",违反者本网将追究相关法律责任。非本网作品均来自互联网并标明了来源,如出现侵权行为,请立即与我们联系,待核实后,我们将立即删除,并向您致歉。
征稿:
为了更好的发挥CPS中安网资讯平台价值,促进诸位自身发展以及业务拓展,更好地为企业及个人提供服务,中安网诚征各类稿件,欢迎有实力安防企业、机构、研究员、行业分析师。投稿邮箱: tougao@cps.com.cn(查看征稿详细)