内容摘要:12月13日,计算机视觉方向的三大顶级会议之一ICCV(国际计算机视觉大会)就要在智利圣地亚哥拉开帷幕了。再远一些,计算机视觉将成为无人车和无人机的眼睛,助推无人货运的普及……戴宇荣觉得,未来正在加速前来。
关键词:计算机视觉;人脸识别;工业界;计算机;视觉技术
作者简介:
12月13日,计算机视觉方向的三大顶级会议之一ICCV(国际计算机视觉大会)就要在智利圣地亚哥拉开帷幕了。
对业内人士来说,这是盛会。当然,非专业人士大概会问:这和我有什么关系?
其实,逐渐从学术界走向工业界的计算机视觉,已经在人们生活中存在很长时间了。
日前,科技日报采访了计算机视觉底层技术领域专家戴宇荣教授。他此前在韩国科学技术院获得终身教职,曾多次担任ICCV领域主席。如今,戴宇荣离开学术界,加入专注计算机视觉的创业公司“商汤科技”。
难点:在一堆数字里找出一个人
戴宇荣教授一直在做的,就是教计算机学会怎么看。“计算机看到的,永远只有0和1的数字。即使是图像,在它们看来,照样是0和1。”他向记者解释,要理解研究者在计算机视觉上遇到的麻烦,就要先了解计算机处理讯息的方法。
想象一下,你现在面对一堆看似毫无规律可循的数字,然后你接到了任务——数字中间藏着一个人,来,把他找出来。这就是计算机要干的事情,它得在数字里找到规律,发现这个藏在数字当中的人,或者一只猫、一朵花。哦,对了,你还得先告诉计算机,长成这样的是人,长成那样的是猫,有着花瓣的这株植物叫“花”,也是够费劲了。
在日常生活的真实场景中,这堆数字经常有缺陷:比如有待识别的物体被遮住了,光照条件不同了,拍摄角度变了……所有这些,都能改变数字的规律。
美图秀秀、人脸识别,都是计算机视觉
那么,计算机的底层和高层视觉技术,又是什么呢?
底层视觉,可以帮计算机进行边缘提取,进行区块分隔,让它看清图像。其实,只要你曾用过Photoshop或者美图秀秀,那么你已经感受过计算机底层视觉技术的魅力了——这些应用都采用了图像增强和图像处理技术。
而且,如果计算机遇到了不那么清晰的画面,底层视觉技术就会对它进行预处理,丰富细节,提高清晰度;然后高层视觉技术就能对画面进行更充分的特点提取,把图像上的物体“认出来”。
至于高层视觉技术,目前最为人所知的应用,当属人脸识别。







