俄罗斯科学家发明了一种计算机视觉系统,可以通过视频图像识别任何物体。样品已交包括国防企业在内的各机构进行试用。
未来客户将能独立“训练”该系统识别其感兴趣的物体。新系统应用范围非常广泛,可以发现战场上敌军的装备,控制羊群,还能帮家用机器人将干净杯子和脏杯子分开。专家认为该系统能力超过操作人员能力,但目前应仅将其用作人类助手。
在镜头中
莫斯科物理技术学院的工程师正努力推广其开发的机器视觉系统。该系统由可见红外区摄像机和数据处理电子部件组成,可自动识别视频中的各种物体。系统算法能实时分析图像,在其中找到搜索的物体或人物。莫斯科物理技术学院无线电技术和电脑技术学校校长加夫里洛夫(Dmitry Gavrilov)说:“具体设备中的摄像头数量和类型无关紧要。其数量可能从一个到几百个不等。具体系统结构取决于其计算能力、安装平台和所需运行速度。设备重量从200克到几十公斤不等。”
新系统具有广泛通用性,算法可加以训练,检测任何物体或人。训练程序只要求选择目标对象,并且训练时既可以使用真实物体,也可以使用其图像。算法起到重要作用的有内置神经网络、硬件实现、系统使用驱动程序、协议和其他细节。同时,目标识别软件为综合性解决方案,神经网络只是其中的一部分。新技术以模块化呈现,可成为各种设备的“眼睛”,比如无人机、汽车、家庭机器人助手,等等。根据安装平台的不同,系统可以满足不同性能和能耗要求。系统运行准确性由其找到目标对象的概率和误差决定,可与人类操作相媲美。人类搜索准确率为89-92%,该算法为92-94%。莫斯科物理技术学院的专家目前正将其开发的软件完全转移到俄罗斯设备上,并计划在步行机器人平台中安装新系统。
在实践中
莫斯科物理技术学院开发的计算机视觉系统可用于工业生产、医疗健康、汽车制造、安全系统或者特殊军事装备。目前该系统已在俄自然资源部项目中使用,在自然保护区识别某些种类的动物,分析其种群。学校正与多个客户合作。一些样品已交客户进行试用。加夫里洛夫说:“某些人工智能系统方面我们部门已为不同客户成功完成研发工作。”学院专家在系统工作准备中负责技术方面问题。该系统的设计特点之一是开发人员可能不知道客户的具体使用目的。客户自行支配收到的设备,训练其学习算法,并自主决定训练其识别哪些对象。例如,可以对系统进行设置,发现具体参照物及相对它的移动。
智慧眼睛
圣彼得堡国立大学技术项目中心工程师布尔达科夫(Pavel Buldakov)说,计算机视觉是个非常有前景的科学方向,需要在国内设备上进行开发和尝试。他说,目前俄国内计算设备仍存在问题,但从软件代码角度看,莫斯科物理技术学院的专家完全可以训练程序识别对象达到必要准确程度。布尔达科夫说:“这种系统应仅用作助手,直到其安全使用多年。人的眼睛不能看到一切。比如,系统在屏幕上显示战场图像,算法在其中突出搜索的目标。但由人作出行动决定。现在系统应被用作提示。”
俄罗斯国立人文大学研究员科托夫(Artemy Kotov)说:“解决目标自动识别的任务在许多领域具有重要意义,比如搜救失踪人员,识别野生动物或牛羊并评估其数量等等。但如果一台配备类似技术的机器,比如机器人,与人类日常共处,那么对机器视觉系统的要求是不同的。”科托夫说:“机器人必须能识别我们的面部表情和手势,例如我们说‘去那边’‘给我拿那个东西’时。机器人在厨房里要不仅能找到杯子,还能将其分为干净的和脏的,并找到拿住脏杯子的位置,将其放进洗碗机。”如果机器人用于户外,而不是室内,它应正确辨识物体间的空间关系,例如如果主人告诉他“从树下拿块石头”,它必须会选择合适的石头。这些例子都表明,机器视觉系统的开发仍有许多有意思的问题。