谷歌意图让机器自动识别视频中人行为
【CPS中安网 cps.com.cn】机器视觉是一项综合技术,包括图像处理、机械工程技术、控制、电光源照明、光学成像、传感器、模拟与数字视频技术、计算机软硬件技术(图像增强和分析算法、图像卡、 I/O卡等)。
谷歌在机器视觉学习方面积累大量的数据以及技术,最近,他们推出了一个新的视频数据库,名称为“原子视觉行为(AVA)“,该数据可由一个或多个标签组成,能够推动计算机视觉识别影像中行为的研究。
说到图像识别,其实谷歌的照片应用就可以自动识别出宠物图像,很多公司也在图片识别上作出很多优化尝试,比如Shutterstock上周公布了一项全新的测试功能,用户可以根据自己的布局来搜索股票照片。
相较于这些发生在静态图像领域的机器视觉识别技术,应用到视频中的难度会更大,因为在视频中,每一帧画面的都包括各种复杂的场景,而且很多时候视频中一个动作是由不同的人发出的。不过视频识别方面的应用现在也有一些案例,比如著名色情网站Pornhub,它可以自动对成人视频进行分类,包括让系统识别出特定的性姿势。
谷歌的软件工程师也解释道, “让机器去识别影像中的人类行为是发展计算机视觉的一大难题,尽管过去几年在图像分类和寻找物体方面取得了突破。”所以谷歌推出了这个AVA数据库,AVA包括80多个被动作标签标注的Youtube视频网址,比如握手、接吻、喝酒、拥抱等等。
谷歌希望通过开放这个数据库,进一步改进他们基于视频识别的机器视觉能力。
声明:
凡文章来源标注为"CPS中安网"的文章版权均为本站所有,如需转载请务必注明出处为"CPS中安网",违反者本网将追究相关法律责任。非本网作品均来自互联网,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。
相关阅读
征稿:
为了更好的发挥CPS中安网资讯平台价值,促进诸位自身发展以及业务拓展,更好地为企业及个人提供服务,中安网诚征各类稿件,欢迎有实力安防企业、机构、研究员、行业分析师。投稿邮箱: tougao@cps.com.cn(查看征稿详细)