欢迎来到一句话经典语录网
我要投稿 投诉建议
当前位置:一句话经典语录 > 心得体会 > 人脸检测心得体会

人脸检测心得体会

时间:2014-10-01 01:41

人像比对系统能够识别人脸吗

人像比对结果清晰吗

人像比对技术就是解决识别人脸是不是同一个人的问题,现在算法也在不断完善,不断优化,可以自定义阈值来判断是不是同一个人,比对结果和采集的头像有关系,现在中安未来可以做到身份证上头像和采集头像做比对,也可以做两个头像的比对

java课程设计(证件照应用,包括人脸识别,裁剪,压缩等的)求实验总结

分几个方面分别的论述一脸识技术和产业发展的相关状况。

第一,人脸识别技术的价值在。

我们把人脸作为一个生物学特征,作为一个商业化运用,只是备选的一个方案之一。

生物学当中,唯一的判断的标准,其实识别从精准度的角度和不可替代的角度来讲,最精准的是虹膜,但是虹膜的识别采集成本非常高,识别的效率相对不是很高,需要等待的时间。

所以这两个条件约束了整个的产业化运用只能局限在相对小众的,对识别要求极高的军工、国防等安全性非常高的远的投入,不适合大范围的推广。

第二,指纹。

我们知道指纹的唯一性比较强,指纹同时采集成本是比较低的,比对成本也不高。

但是为什么指纹没有成为一个特别大的可供支付、刷脸可替代的方案呢

实际上主要的原因是因为指纹的可复制性,是一个静态图像之间的比对,现在我们可以看到淘宝也好,各种各样的大量的指纹贴,指纹膜,可复制的特征,不适合支付。

所以指纹现在也大致上被pass了。

第 三和第四分别是人脸识别和声音识别技术。

这两个在现在横向来相比,采集成本和比对的效率,以及生命特征的唯一性来讲,性价比比较高。

所以现阶段来看,人脸识别浮出水面,是有它的道理的,这是它的价值。

商业特征的应用场景到底在哪里。

人脸识别的应用场景是非常宽泛的,现在主要两块,一个是金融行业,一个是安保行业。

金融行业,已经从马云的蚂蚁金服演示中看到了场景,通过刷脸进行支付,显然刷脸可以付钱了,为什么不可以签收快递呢,下一步淘宝应该会把淘宝签收快递的功能打通。

我相信有一天,我们会收到无人机送来的快递,无人机在你的面前拍一张照片,进行对比,就知道这个用户就是需要的用户,完成整个的支付过程。

实际上这种场景,是经过多方面的讨论和认证的。

基于这样的场景,是跟第三方的支付认证相关的,包括我们看到的腾讯的银行,第一张远程开卡,就是通过人脸识别的技术,把人证合一进行认证,这样远程开户,远程开卡的功能,在我们的券商,在我们的网络银行上面,应该有广泛的应用。

对于安保行业来说,刷脸开门,现阶段,人脸识别的应用应该说达到了一个可具备商业化的水平,我们举个例子,在去年的时候,香港有一个导演叫许鞍华,他在南京地铁中丢了一个他的皮包,这个案件的破获,只花了5个小时。

视频监控里面获取了一张照片截图,截到了嫌疑人的照片,是极其模糊的,侧脸的照片,如果肉眼比对,发现不了什么。

但是有一家非上市公司,在这里不能提供他的公司名称,他们通过一个图像还原技术,把那个照片还原出可能嫌疑人的样子,清晰照,用这个照片到图库当中比对,锁定嫌疑人的身份,把嫌疑人抓获,只需要了5个小时的时间。

现在安防领域的监控,我们可以看到各个省市以及地级市,都在上大量的视频监控,人脸识别的大平台。

在整个安防的投入当中,上一代的安防只是静态的记录下来数据,但是下一代的安防,是对实时数据的采集、辨认,就是一个核心的技术,这个技术,人脸识别在其中发挥的作用是很大的。

我 们再拓展一下,未来的商业用途,到底有没有第二代人脸识别技术的潜在的应用的场景呢。

我们说在未来,应该说原来整个确定身份的身份证,但是证和人的比对需要人工来完成。

如果我们直接界定,达到了这样的一个标准,实际上每个人所对应的唯一的ID就是脸部的生物特征。

这个识别了以后,所有的地方都可以用刷脸的方式,所有的地方都可以用刷脸去开门,用刷脸去做各种各样的事情。

你刷脸的数据,包括你去坐火车、坐飞机、去哪儿吃饭、购物、收快递等等,这些数据都会掌握到人脸识别中,刷脸的数据将取代现在线上的点击量.现在信用卡、银行卡消费的数据,其实有助于知道用户消费习惯和消费数据,做大数据的营销和征信,但是刷脸时代来临之后,这个的价值更大了。

有很多张卡,但是只有一张脸,这是唯一的。

刷脸数据是2.0时代当中,我们重点看到的。

为什么在这个时间段,人脸识别的技术会大范围的爆发出来,大范围的应用起来,成熟度到底怎么样呢

我们首先要界定一下人脸识别技术要达到产品化的应用,是两阶段的过程。

第一阶段,需要获取大量的样本数据,这些数据是用于训练的,训练的是学习算法,这个是深度学习算法,把这些数据和相互人之间的关系提取出来,进行一个特别的比对。

耦合度高,超过一定的水平之后,我们会认定这两个人是一个人,但是这个模型是需要投入大量的成本,这个成本包括优化的成本,包括数据训练的成本,包括运算的成本,我们当时人脸识别的一个业内的公司,这家公司的创始人,曾经说,人脸识别的技术意味着什么呢

太上老君的炼丹炉,有了这个炉之后,大数据是炉子炼的原料,解决计算能力资源的稀缺。

因此这些合在一起,形成了现在人脸识别大爆发的时代,就是我们说的技术上的突破。

但是在产业上面的应用来看,目前我们可以看到,美国和以色列的人脸识别,特别是动态识别的水平是国际领先的。

全网的实时监控当中,FBI在去年推出了他们的下一代的电子识别系统,总的投入是超过10亿美金的。

在美国将来无论是在什么地方犯了事,监控锁定犯罪嫌疑人,进行全网追捕。

国内是什么水平呢

顶尖的学术水平,就代表着国内产业发展的阶段。

目前主要是三种力量,一个是清华大学的苏光大教授,他是中国的人脸识别之父。

第二个是中科院的自动化所的李教授,他早年在微软的亚洲研究院当中获得了非常高的成就,后来到了中科院的自动化所,专攻人脸识别。

在奥运会当中,以及后来很多的人脸识别的应用当中,提供了比较好的技术。

第三支就是香港中文大学的汤晓鸥教授的团队,每年会进行学术界的比赛,他是高记录的保持者。

目前的识别率是超过了人类的脸部识别的总体水平,汤教授帮助讯飞在语音识别领域之后,在人脸识别的领域当中,建立了自己的行业地位。

所以国内基本上目前是这样的发展阶段,我们去推导下面的阶段,我们怎么去甄别人脸识别的技术,到底哪一家靠谱,哪一家不靠谱,我们可以提出一些关键的甄别的关键点。

这些点在哪里呢

第我们要区分的,动态和静态配合式的识别还是非配合式的识别。

配合式的就是像蚂蚁金服那样的,需要数据的比对方进行配合,可以很好的去采集正脸的二维的数据。

另外,就是非配合式的,非配合式的没有办法对排除方的配合,是需要随机采集的图片进行比对,这个识别的效果会差一些,但是识别的时效性会很高。

这两种模式当中,我们关注三点。

第一点,你的人脸建模当中到底提取了多少个特征点进行比对,这个跟我们人脸上面的一些特征是关键节点,每个人的差异很大,而你选取的特征点的数据越多,比对的准确率就会越高。

我们也采访了一些专家,他们目前能够做到的特征点的比对,应该是在700个点以上。

目前大部分做刷脸的门禁这样系统产品的公司,特征点的选取大概是在50个左右。

所以我们去做调研和交流,可以问一下整个公司人脸识别建模当中特征点的数量。

第二点,人脸识别数据库的数据样本和大小,这是一个非常重要的指标。

样本及大小,是我们可供的数据集,这些必须要对人脸,比如说一个人有500张照片,拍的都是他的脸,不同的角度和位置、光线,把这些数据进行合理的清洗,供机器去训练包括比对和识别之后,可以告诉你是识别对了还是识别错了,这样的样本数非常重要,有助于训练,提高模型的准确率。

因此可标签的数据样本集的大小,这个大小目前至少是百万以上的级别,才会使得现在识别率能够提升到世界领先的水平,这个也是可以甄别的关键点之一。

第三点,是不是你的商业模式能够对你的整个的数据的获取,我们说人脸数据的比对,形成一个正循环的模式。

实际上数据来源,人脸的样本来源,是来源于两个非常重要的渠道,美图秀秀和美颜照相机,这是一个商业的互换,这个数据,因为考虑到做一个脱敏的处理,剩下的只有几百个关键的特征点的数据,其他的都被略去,用脱敏的技术之后,形成了从获取数据到训练模型,再到优化模型,持续的反馈结果,获取新的数据,这样的一个正循环的过程。

有了这个以后,你的模型的数据就会获取的很好了,这是商业模式上非常重要的一个指标。

如果有了这三个指标之后,应当说同时具备了这三个,可能是在人脸识别领域当中有非常大的领先优势,或者是未来发展潜力的东西。

同时我们在直观的性能方面去分析,直观的到底识别的表现上有两个非常重要的指标,一个是识别的准确率,我们界定了刚才说的学术界当中,每年一比的人脸识别大赛,现在基本上测试水平都在95%以上,但是是人和图片之间相互比对,说明是这个人,这算一个,再比对一个,又对了,算第二个。

所有的人和照片都是匹配好的,最后正确率在99.2%左右,这是我们说的目前的正常的比对方法。

还有一个非常重要的方法,我们看到商业银行和淘宝在内的一些人脸识别的技术,会提出一个错误率的问题,这个数据,目前来看可以做到十万分之一的错误率,别人拿着我的身份证去比对,如果机器能够区分出来,是不通过,这是对的。

如果机器把我的身份证给别人的时候也通过了,这可能就是一个错误的,错误率要在十万分之一左右才可以,目前能达到这样错误率的公司是屈指可数的,这是一个识别准确率的问题.另外还是在多大样本中可以实现这样的准确率,这个是至关重要的。

一个公司里面也就是两三百个人,在这些人当中,挑选出来通过,没有什么难度。

但是在公安部的大平台当中,省级的平台当中,都是上亿人的身份证照片中,要准确的挑出来十个或者是一百个候选人,这个范围缩小到这个概率当中,你的准确率能有多大,这是一个很重要的指标。

第二点,识别的速度问题。

同样还是刚才我们说到的样本集的大小决定了识别的速度。

本身你在可供比对的样本中,没有很大的数据,比如说是成千上万的,识别的数大家都是差不多,都是在1秒之内作出反映,但是如果在一个上亿的大的样本当中,去把照片准确的识别出来,这样对时间的要求,对效率反映的要求就提高了。

所以识别速度是一个很重要的指标。

以上我们说了五个指标,我们说这个确实是可以对公司的具体能力和技术进行综合判断的。

基于以上我们说的这些,关注的公司是有识别技术的公司,这个识别技术是人脸识别的技术。

我们前面讲了,本身国内发言的几支学术界的力量大家非常清楚,来源于哪一支,背靠着哪一支强大的学术团队,研究团队的力量,使得这家公司是一个很好的位置。

比如说我们前面讲到的科大讯飞,在汤晓鸥教授的支持下,他们的团队是学术界第一的力量在支持他们,这是一个资源性的优势。

比如说川大智胜,这个和李教授他们有密切的合作,同时他们自己在图象识别领域当中,也有自己独特的技术,承担着国家大量的科研基金的项目,同时我们也特别强调一个就是川大智胜的人脸识别技术,是目前我们看到的人机交互,因为这个和二维的平面识别有很大的区别,优势非常明显,因为采集到了五官之间立体曲面之间的结合,所以采集到的数据量更丰富。

可供比对的特征也是更多的,我们之前在视频当中找到拍到的侧脸,不清晰的照片,很难去识别出来犯罪嫌疑人到底是谁,是因为我们二代身份证库当中,本身就是只有正脸的可供比对的数据。

三代或者是四代身份证采集数据的过程当中生物特征肯定要被提取出来,首先是指纹,三维的人脸识别会更快,三代四代可能就会被提取。

一旦需要被提取到三维的人脸的数据,那么这个时候川大智胜作为国内目前唯一一家有产品和技术的公司,面临的是广阔的市场。

但是我们同时也要看到,三维人脸识别虽然有非常惊人的优势,同时劣势也是非常明显的,特征点的选取,包括侧脸的选取,是有难度的。

同时表情的因素,其实对于数据处理的影响,没有在立体表情的因素那么好,提取的时候效率是偏低的,消耗的数据也非常大。

所以现在来看,我们能够看到的应用场景目前还是小范围的,包括像美国对犯罪的有案底的犯人,我们国内目前在监狱当中也逐步的推广,将来全民都要采集,这肯定是一个非常巨大的市场。

同时这家公司在人脸识别公司当中,技术特点和现在持续的对三维人脸识别加码,有一个项目是1.8个亿,要投入到研发当中,国家自然科学基金也已经持续的支持他们三维人脸识别的学术研究的项目,已经支持了很多年。

所以在这个领域,应该是到了开花结果的地步。

所以这一点,我们特别提示大家要关注这个公司,在技术上确实是有稀缺性的。

科大讯飞,就是典型的我们刚才讲的商业模式,可以实现人脸识别数据正循环的公司,是拥有互联网端的入口的。

之前在语音的领域当中,讯飞语音云走的就是这样的模式,我获取的是你语音的数据,用你的数据持续的训练我后台的算法,使得他们提升和保持和其他竞争对手的领先优势。

这样的话,数据端的循环,从语音的这个领域当中,复制到图像识别,就是人脸识别当中。

大家如果关注讯飞,大家可以看到,在上个星期的时候,推出了双重生物特征的识别的因素,双重是什么呢

两重加密以后,确实就是这个人,把出错的概率降到非常低的水平。

同时识别,双重加密之后,这个身份验证的过程可以做到数量级上面的提升。

有了这样一种开放云的平台之后,讯飞的数据正规化的过程也在逐步的建立,他下一步会和非常多的第三方的应用方合作,包括可以刷脸开锁的智能硬件方面,包括和电话银行,电话客服,还有邮箱去实现他的数据入口的正循环的过程。

我们核心的问题就是以上的这样的一些判断的标准来去甄别的。

我认为讯飞实际上是非常有希望的人脸识别的公司。

我们在报告当中,也提到了讯飞是一个生态级的公司,不光是在人脸识别的这个领域当中有比较强的资源优势和技术优势,以及商业模式的优势。

同时在我们整个的人工智能领域当中,讯飞超脑可以不断的用它孵化,基于学习的模式,从语音迁移到现在的图像,下一步迁移到语义当中,不断的做技术的衍生,这样的生态链一旦形成的话,在人工智能产业的地位是不可动摇的。

所以人工智能整个的产业,我们想推的是科大讯飞。

人脸识别的领域当中,讯飞的优势也是非常明显的,同时我们也是看好川大智胜拥有的三维人脸识别的技术。

其他的品牌公司,我们可以看到欧比特收购的公司,在安防领域的人脸识别当中,在监狱当中是超过50%的,在产品化方面也做的非常好。

其他的两家,刚刚推出了自己的识别技术,现在了解的信息当中,还没有办法很好的甄别他们现在是否拥有满足我们以上的五个标准。

在以后的调研和跟踪当中,我们会对他们的标准进行梳理和进一步的分解。

这是对识别类公司的分析.下一个阶段,我们觉得还有比较好的投资机会,除了第一类识别类的,第二类应该是数据资源类的,数据资源目前来看就是视频资源,有比较好的视频资源的公司,可以通过视频资源进行持续的深度学习的算法和优化,也许他自己没有这个技术和能力,但是可以通过技术合作的方式,找到研发团队或者是公司进行合作,共同开发优势。

目前在视频资源当中的这些公司进行梳理的话,我觉得东方网力在这个当中步子迈的最前。

目前产品端还是没有关于人脸识别成型的产品推出来,但是他的应用是在于多年的视频数据的积累。

这个是和后期有密不可分的关系。

先收购了广州的安防领域的视频监控的智能化的公司,这个步子一迈出去,布局的意图非常的明显。

摄象头公司会往视频的公司侵占,后面的公司将来可能会往存储的环节去挤压,有可能将来会把分析和存储在一个环节当中就完成了,这个时候面临的压力是比较大的,所以转型的动力也是最迫切的,意愿也是最强烈的。

所以总体总结下来,现在人脸识别技术大爆发,并不是偶然的,应该说很好的满足了我们讲的人工智能的三大条件。

深度学习的算法,大数据和云计算,这三个条件成熟了以后,在拐点到来的时候,大规模的商业化应用是水到渠成的。

下一个阶段,基于计算机视觉的应用,在视频监控领域当中,对人的行为模式的识别、跟踪和分析,这些都会成为一个非常大的市场,成熟度还有待于进一步的检验。

但是这个市场我们已经都看得到了,所以现在我跟大家探讨人脸识别的产业的发展机会,我觉得其实大家需要关注的不仅仅在于人脸识别技术本身的发展,也不仅仅在于哪几家上市公司拥有哪几项技术,而是看到背后代表的是整个计算机视觉的兴起。

人工智能报告当中也提到过,计算机视觉的1.0版本,是对静态图像的识别,2.0版本,肯定是动态视频内容的理解和学习,包括像谷歌的无人驾驶汽车,包括报告里面提到过的以色列的那个公司,也是纳斯达克上市的,他们用计算机视觉的技术实现了汽车的辅助的无人驾驶。

在这个领域当中,实际上计算机视觉可供开发的应用非常丰富的。

现在还有一个法律的问题,就是允许不允许无人驾驶的汽车上路,合法不合法的问题,大家不用担心这个问题。

因为这个公司IPO的时候,这个公司的CEO说过一句话,他说现在还在担心无人驾驶的汽车上路合法不合法,但是我可以肯定的告诉你,十年以后,人开车上路是不合法的,这肯定是一个大的方向和趋势。

这就是我从人工智能的领域延伸出来的,人脸识别只是一个点,更多的还有待于大家去一点一点的发掘。

python人脸识别所用的优化算法有什么

1https:\\\/\\\/github.com\\\/ageitgey\\\/face_recognition\\\/blob\\\/master\\\/examples\\\/facerec_from_webcam_faster.py

人脸识别的发展历史是怎样的

人脸识别是一个被广泛研究着的热门问题,大量的研究论文层出不穷,在一定程度上有泛滥成“灾”之嫌。

为了更好地对人脸识别研究的历史和现状进行介绍,本文将AFR的研究历史按照研究内容、技术方法等方面的特点大体划分为三个时间阶段,如表1所示。

该表格概括了人脸识别研究的发展简史及其每个历史阶段代表性的研究工作及其技术特点。

下面对三个阶段的研究进展情况作简单介绍: 第一阶段(1964年~1990年) 这一阶段人脸识别通常只是作为一个一般性的模式识别问题来研究,所采用的主要技术方案是基于人脸几何结构特征(Geometricfeature based)的方法。

这集中体现在人们对于剪影(Profile)的研究上,人们对面部剪影曲线的结构特征提取与分析方面进行了大量研究。

人工神经网络也一度曾经被研究人员用于人脸识别问题中。

较早从事AFR研究的研究人员除了布莱索(Bledsoe)外还有戈登斯泰因(Goldstein)、哈蒙(Harmon)以及金出武雄(Kanade Takeo)等。

金出武雄于1973年在京都大学完成了第一篇AFR方面的博士论文,直到现在,作为卡内基-梅隆大学(CMU)机器人研究院的一名教授,仍然是人脸识别领域的活跃人物之一。

他所在的研究组也是人脸识别领域的一支重要力量。

总体而言,这一阶段是人脸识别研究的初级阶段,非常重要的成果不是很多,也基本没有获得实际应用。

第二阶段(1991年~1997年) 这一阶段尽管时间相对短暂,但却是人脸识别研究的高潮期,可谓硕果累累:不但诞生了若干代表性的人脸识别算法,美国军方还组织了著名的FERET人脸识别算法测试,并出现了若干商业化运作的人脸识别系统,比如最为著名的Visionics(现为Identix)的FaceIt系统。

美国麻省理工学院(MIT)媒体实验室的特克(Turk)和潘特兰德(Pentland)提出的“特征脸”方法无疑是这一时期内最负盛名的人脸识别方法。

其后的很多人脸识别技术都或多或少与特征脸有关系,现在特征脸已经与归一化的协相关量(NormalizedCorrelation)方法一道成为人脸识别的性能测试基准算法。

这一时期的另一个重要工作是麻省理工学院人工智能实验室的布鲁内里(Brunelli)和波基奥(Poggio)于1992年左右做的一个对比实验,他们对比了基于结构特征的方法与基于模板匹配的方法的识别性能,并给出了一个比较确定的结论:模板匹配的方法优于基于特征的方法。

这一导向性的结论与特征脸共同作用,基本中止了纯粹的基于结构特征的人脸识别方法研究,并在很大程度上促进了基于表观(Appearance-based)的线性子空间建模和基于统计模式识别技术的人脸识别方法的发展,使其逐渐成为主流的人脸识别技术。

贝尔胡米尔(Belhumeur)等提出的Fisherface人脸识别方法是这一时期的另一重要成果。

该方法首先采用主成分分析(PrincipalComponent Analysis,PCA,亦即特征脸)对图像表观特征进行降维。

在此基础上,采用线性判别分析(LinearDiscriminant Analysis, LDA)的方法变换降维后的主成分以期获得“尽量大的类间散度和尽量小的类内散度”。

该方法目前仍然是主流的人脸识别方法之一,产生了很多不同的变种,比如零空间法、子空间判别模型、增强判别模型、直接的LDA判别方法以及近期的一些基于核学习的改进策略。

麻省理工学院的马哈丹(Moghaddam)则在特征脸的基础上,提出了基于双子空间进行贝叶斯概率估计的人脸识别方法。

该方法通过“作差法”,将两幅人脸图像对的相似度计算问题转换为一个两类(类内差和类间差)分类问题,类内差和类间差数据都要首先通过主成分分析(PCA)技术进行降维,计算两个类别的类条件概率密度,最后通过贝叶斯决策(最大似然或者最大后验概率)的方法来进行人脸识别。

人脸识别中的另一种重要方法——弹性图匹配技术(Elastic GraphMatching,EGM) 也是在这一阶段提出的。

其基本思想是用一个属性图来描述人脸:属性图的顶点代表面部关键特征点,其属性为相应特征点处的多分辨率、多方向局部特征——Gabor变换[12]特征,称为Jet;边的属性则为不同特征点之间的几何关系。

对任意输入人脸图像,弹性图匹配通过一种优化搜索策略来定位预先定义的若干面部关键特征点,同时提取它们的Jet特征,得到输入图像的属性图。

最后通过计算其与已知人脸属性图的相似度来完成识别过程。

该方法的优点是既保留了面部的全局结构特征,也对人脸的关键局部特征进行了建模。

近来还出现了一些对该方法的扩展。

局部特征分析技术是由洛克菲勒大学(RockefellerUniversity)的艾提克(Atick)等人提出的。

LFA在本质上是一种基于统计的低维对象描述方法,与只能提取全局特征而且不能保留局部拓扑结构的PCA相比,LFA在全局PCA描述的基础上提取的特征是局部的,并能够同时保留全局拓扑信息,从而具有更佳的描述和判别能力。

LFA技术已商业化为著名的FaceIt系统,因此后期没有发表新的学术进展。

由美国国防部反毒品技术发展计划办公室资助的FERET项目无疑是该阶段内的一个至关重要的事件。

FERET项目的目标是要开发能够为安全、情报和执法部门使用的AFR技术。

该项目包括三部分内容:资助若干项人脸识别研究、创建FERET人脸图像数据库、组织FERET人脸识别性能评测。

该项目分别于1994年,1995年和1996年组织了3次人脸识别评测,几种最知名的人脸识别算法都参加了测试,极大地促进了这些算法的改进和实用化。

该测试的另一个重要贡献是给出了人脸识别的进一步发展方向:光照、姿态等非理想采集条件下的人脸识别问题逐渐成为热点的研究方向。

柔性模型(Flexible Models)——包括主动形状模型(ASM)和主动表观模型(AAM)是这一时期内在人脸建模方面的一个重要贡献。

ASM\\\/AAM将人脸描述为2D形状和纹理两个分离的部分,分别用统计的方法进行建模(PCA),然后再进一步通过PCA将二者融合起来对人脸进行统计建模。

柔性模型具有良好的人脸合成能力,可以采用基于合成的图像分析技术来对人脸图像进行特征提取与建模。

柔性模型目前已被广泛用于人脸特征对准(FaceAlignment)和识别中,并出现了很多的改进模型。

总体而言,这一阶段的人脸识别技术发展非常迅速,所提出的算法在较理想图像采集条件、对象配合、中小规模正面人脸数据库上达到了非常好的性能,也因此出现了若干知名的人脸识别商业公司。

从技术方案上看, 2D人脸图像线性子空间判别分析、统计表观模型、统计模式识别方法是这一阶段内的主流技术。

第三阶段(1998年~现在) FERET’96人脸识别算法评估表明:主流的人脸识别技术对光照、姿态等由于非理想采集条件或者对象不配合造成的变化鲁棒性比较差。

因此,光照、姿态问题逐渐成为研究热点。

与此同时,人脸识别的商业系统进一步发展。

为此,美国军方在FERET测试的基础上分别于2000年和2002年组织了两次商业系统评测。

基奥盖蒂斯(Georghiades)等人提出的基于光照锥 (Illumination Cones) 模型的多姿态、多光照条件人脸识别方法是这一时期的重要成果之一,他们证明了一个重要结论:同一人脸在同一视角、不同光照条件下的所有图像在图像空间中形成一个凸锥——即光照锥。

为了能够从少量未知光照条件的人脸图像中计算光照锥,他们还对传统的光度立体视觉方法进行了扩展,能够在朗博模型、凸表面和远点光源假设条件下,根据未知光照条件的7幅同一视点图像恢复物体的3D形状和表面点的表面反射系数(传统光度立体视觉能够根据给定的3幅已知光照条件的图像恢复物体表面的法向量方向),从而可以容易地合成该视角下任意光照条件的图像,完成光照锥的计算。

识别则通过计算输入图像到每个光照锥的距离来完成。

以支持向量机为代表的统计学习理论也在这一时期内被应用到了人脸识别与确认中来。

支持向量机是一个两类分类器,而人脸识别则是一个多类问题。

通常有三种策略解决这个问题,即:类内差\\\/类间差法、一对多法(one-to-rest)和一对一法(one-to-one)。

布兰兹(Blanz)和维特(Vetter)等提出的基于3D变形(3D Morphable Model)模型的多姿态、多光照条件人脸图像分析与识别方法是这一阶段内一项开创性的工作。

该方法在本质上属于基于合成的分析技术,其主要贡献在于它在3D形状和纹理统计变形模型(类似于2D时候的AAM)的基础上,同时还采用图形学模拟的方法对图像采集过程的透视投影和光照模型参数进行建模,从而可以使得人脸形状和纹理等人脸内部属性与摄像机配置、光照情况等外部参数完全分开,更加有利于人脸图像的分析与识别。

Blanz的实验表明,该方法在CMU-PIE(多姿态、光照和表情)人脸库和FERET多姿态人脸库上都达到了相当高的识别率,证明了该方法的有效性。

2001年的国际计算机视觉大会(ICCV)上,康柏研究院的研究员维奥拉(Viola)和琼斯(Jones)展示了他们的一个基于简单矩形特征和AdaBoost的实时人脸检测系统,在CIF格式上检测准正面人脸的速度达到了每秒15帧以上。

该方法的主要贡献包括:1)用可以快速计算的简单矩形特征作为人脸图像特征;2)基于AdaBoost将大量弱分类器进行组合形成强分类器的学习方法;3)采用了级联(Cascade)技术提高检测速度。

目前,基于这种人脸\\\/非人脸学习的策略已经能够实现准实时的多姿态人脸检测与跟踪。

这为后端的人脸识别提供了良好的基础。

沙苏哈(Shashua)等于2001年提出了一种基于商图像[13]的人脸图像识别与绘制技术。

该技术是一种基于特定对象类图像集合学习的绘制技术,能够根据训练集合中的少量不同光照的图像,合成任意输入人脸图像在各种光照条件下的合成图像。

基于此,沙苏哈等还给出了对各种光照条件不变的人脸签名(Signature)图像的定义,可以用于光照不变的人脸识别,实验表明了其有效性。

巴斯里(Basri)和雅各布(Jacobs)则利用球面谐波(Spherical Harmonics)表示光照、用卷积过程描述朗博反射的方法解析地证明了一个重要的结论:由任意远点光源获得的所有朗博反射函数的集合形成一个线性子空间。

这意味着一个凸的朗博表面物体在各种光照条件下的图像集合可以用一个低维的线性子空间来近似。

这不仅与先前的光照统计建模方法的经验实验结果相吻合,更进一步从理论上促进了线性子空间对象识别方法的发展。

而且,这使得用凸优化方法来强制光照函数非负成为可能,为光照问题的解决提供了重要思路。

FERET项目之后,涌现了若干人脸识别商业系统。

美国国防部有关部门进一步组织了针对人脸识别商业系统的评测FRVT,至今已经举办了两次:FRVT2000和FRVT2002。

这两次测试一方面对知名的人脸识别系统进行了性能比较,例如FRVT2002测试就表明Cognitec, Identix和Eyematic三个商业产品遥遥领先于其他系统,而它们之间的差别不大。

另一方面则全面总结了人脸识别技术发展的现状:较理想条件下(正面签证照),针对37437人121,589 幅图像的人脸识别(Identification)最高首选识别率为73%,人脸验证(Verification)的等错误率(EER[14])大约为6%。

FRVT测试的另一个重要贡献是还进一步指出了目前的人脸识别算法亟待解决的若干问题。

例如,FRVT2002测试就表明:目前的人脸识别商业系统的性能仍然对于室内外光照变化、姿态、时间跨度等变化条件非常敏感,大规模人脸库上的有效识别问题也很严重,这些问题都仍然需要进一步的努力。

总体而言,目前非理想成像条件下(尤其是光照和姿态)、对象不配合、大规模人脸数据库上的人脸识别问题逐渐成为研究的热点问题。

而非线性建模方法、统计学习理论、基于Boosting[15]的学习技术、基于3D模型的人脸建模与识别方法等逐渐成为备受重视的技术发展趋势。

总而言之, 人脸识别是一项既有科学研究价值,又有广泛应用前景的研究课题。

国际上大量研究人员几十年的研究取得了丰硕的研究成果,自动人脸识别技术已经在某些限定条件下得到了成功应用。

这些成果更加深了我们对于自动人脸识别这个问题的理解,尤其是对其挑战性的认识。

尽管在海量人脸数据比对速度甚至精度方面,现有的自动人脸识别系统可能已经超过了人类,但对于复杂变化条件下的一般人脸识别问题,自动人脸识别系统的鲁棒性和准确度还远不及人类。

这种差距产生的本质原因现在还不得而知,毕竟我们对于人类自身的视觉系统的认识还十分肤浅。

但从模式识别和计算机视觉等学科的角度判断,这既可能意味着我们尚未找到对面部信息进行合理采样的有效传感器(考虑单目摄像机与人类双眼系统的差别),更可能意味着我们采用了不合适的人脸建模方法(人脸的内部表示问题),还有可能意味着我们并没有认识到自动人脸识别技术所能够达到的极限精度。

但无论如何,赋予计算设备与人类似的人脸识别能力是众多该领域研究人员的梦想。

相信随着研究的继续深入,我们的认识应该能够更加准确地逼近这些问题的正确答案。

面部识别是不是是张脸就能解开啊,更别说睁眼闭眼了

初恋的女友为钱抛弃了他

从此他不相信爱情,认为女人的“爱情”等于钞票的厚度

声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。联系xxxxxxxx.com

Copyright©2020 一句话经典语录 www.yiyyy.com 版权所有

友情链接

心理测试 图片大全 壁纸图片