重庆频道消息 人脸识别技术越来越广泛运用到生活中,但仍然存在盲点,比如低头或是在角落,摄像头往往无法识别到完整人脸。
怎样才能不刷脸也能识人?昨日,都市传媒记者获悉,重庆科技企业——云从科技在跨镜追踪技术上取得重大突破,同时刷新3项权威数据集世界纪录。
“简单地理解,跨镜追踪技术可以让人工智能通过衣物、发型、体态等信息,跨摄像头跨场景准确追踪人的位置。我们的技术,在Market-1501上的首位命中率已经达到96.6%。”云从研究院副总监周翔说。
用各种道具刁难自己
昨日下午,走进云从科技科研人员办公室,记者震惊了,除了电脑,每个人桌子上几乎都有一叠人像资料。令人意外的,还有一箱子各式各样假发、人皮面具、假人头、面具等,这些是用来干啥的?
85后总监周翔随手拿起一个人皮面具笑道:“这些东西是用来为难我们的研发成果的。”用人皮面具为难自己的研发?没错,每研发出一款产品,他们就会绞尽脑汁进行测试。
人脸识别技术已经广泛运用到银行系统,如果不法分子戴着面罩或者戴着高精度人皮面具,能否识别出来?周翔说,他们常常进行头脑风暴,买来各种道具刁难自己研发出来的系统。
拿着一个五官精致的假人头,站在人脸识别镜头前,显示屏立刻显示“unlive(非活体)”。“其实这就是活体识别,我们要考虑所有可能发生的情况,不断测试、完善更新系统。”周翔说,他们研发的人脸识别技术已经在公安和银行系统广泛运用,沙坪坝区警方曾利用这个系统,一个月破获30多起案件。
给自己设定小目标
人脸识别技术在许多领域的实际使用过程中,用户提出了新要求。“比如公安,在侦破案件的过程中发现,有的镜头角度无法完整识别出人脸。这就提出了更高的要求:有没有可能通过人物形体、局部镜头,跨镜头追踪目标人物?”周翔说,从去年下半年开始,他和团队其他4位小伙伴一起着手这项研究。
5个核心成员清一色85后,其中3个人在上海的公司,两个人在重庆的公司,平时就在网上交流。与印象中的工科男不同,他们不仅不宅,而且爱好广泛。周翔来自湖北省,在重庆工作快7年,最喜欢吃火锅,周末喜欢背上背包自由行。加班很晚时,最享受的就是大家一起吃顿火锅。“程序写不出来时,我就去跑步,大汗淋漓回来,头脑更清晰。”周翔说。
拿着照相机在街头收集人脸素材,是工作常态。因为需要大量素材,他们要在人流最集中时间、地段抓拍。另外,还要查阅权威期刊,查看各种学术研究资料,看看别人是怎么做到的、准确率是多少。
据介绍,跨镜追踪技术简称ReID,目前是计算机视觉研究热门方向,是一项利用计算机视觉技术判断图像或者视频序列中是否存在特定行人的技术。它可以无需人脸,只看穿着、体态、发型就能识别某个人。作为人脸识别技术的重要补充,可以对无法获取清晰人脸的行人进行跨摄像头连续跟踪。Market-1501、CUHK03、DukeMTMC-reID,是当前衡量ReID技术的最权威主流数据集。
“此前我们了解到,世界最高纪录是Market-1501准确率达到95%,于是从最开始,我们给自己设定的小目标是实现80%。”周翔说,朝着这个小目标,他和团队小伙伴们开始了努力。
给大脑添加一个小脑
在云从科技,每个月会有一到两次的分享讲座,邀请员工分享各自科研成果,能够成为主讲人是一件很自豪的事。当周翔和小伙伴们的小目标达到93%时,他们成为了主讲人,站上讲台给同事们分享研发经历。
“这时候,我们离世界最好成绩只有2%距离,也是一个瓶颈。怎样才能有所突破?”周翔说,他们想到更加精细的细节,人物脸上的痣、手上戴的手表、裤子上有没有裤包……于是,他们在原有程序上添加程序,相当于给大脑添加了一个小脑。
经过半年努力,他们从悉尼科技大学、南洋理工、中科院自动化所、清华大学等多家知名高校、企业与研究机构当中脱颖而出,同时刷新Market-1501、DukeMTMC-reID、CUHK03这3项权威数据集世界记录,其中最高的Market-1501首位命中率达到96.6%,打破了阿里iDST(数据科学与技术研究院)在今年1月创造的世界纪录。值得一提的是,他们还将Market-1501平均精度均值指标在现有最好水平基础上提高近5%,使得跨镜追踪技术加速实现商用。
“下一步,我们还在设想,有没有可能通过人物的动作,判断他的下一个行为。我们要在行为识别上进行一些研究。”周翔说。