未来论坛山世光从看脸到读心深刻理解人

“世间一切,尽在脸上”

以下文章来源于未来论坛。

未来论坛是当前中国最具声望的民间科学公益组织,由一群崇尚科学、热心公益的科学家、企业家共同发起创立。自成立以来,未来论坛秉承“弘扬科学精神,助力科创兴国”的宏伟使命,全面推动产学研资政融合和大众科普事业发展,迄今已凝聚了数百位全球杰出科学家、顶尖投资人和卓越产业领袖,是中国唯一的商学跨界的科学公益平台。未来论坛于年创设未来科学大奖,奖励主要在大中华地区做出具有国际影响力的原创科研工作的科学家。

以人脸识别为代表的“看脸”技术已经逐渐走向成熟。那接下来我们该让AI看什么呢?希斯罗说“世间一切,尽在脸上”,人人都具备一定的察言观色能力,老中医甚至可以“望诊”。“看脸”的下一步是“读心”,即通过对人的视觉观察,深刻理解人内在心理状态甚至精神状况的技术。

作为未来科学大奖周系列活动中,聚焦科技创新思想的展示,“青年秀”以“八大引领未来的前沿科技”为主题,由8位杰出华人青年科学家分享生命与健康、智能生活、能源与环境及基础科学领域中将引领未来的前沿科技及创新思想。

本届青年秀上,中国科学院计算技术研究所的山世光教授发表主题演讲:从看脸到读心——深刻理解人的视觉智能。想让计算机通过学习人的能力来变得更智能,山世光的团队正在教计算机“读心术”,希望用人工智能深入表面直指人心。本次演讲介绍了该领域的近期进展、趋势和挑战,并展示他的课题组在这方面的一些研究成果。

从看脸到读心——深刻理解人的视觉智能

山世光:大家好。非常高兴有机会来给大家做一次分享。就像刚才主持人讲的,其实我不是真的脸盲了,但是确实在认人方面没有那么强大。

我们知道其实人脸识别在过去的5年时间里面,有了一个跨越式的进步,可以说人脸识别之战基本上已经接近尾声。那么现在剩下的主要是一些零星的枪声了。

我们知道其实我们从人脸上可以看到的东西,不仅仅是它是谁,或者他是男是女,长得好看不好看。

我们还可以有更多的信息,希思罗说“世间一切,尽在脸上”,在脸上我们还可以看到非常多的内容,解读的最广泛的就是蒙娜丽莎,甚至有团队认为说她微笑里面其实有9%的厌恶,6%的恐惧,还有2%的愤怒。

我不知道这个解读大家有没有看出来,反正我是没有看出来。甚至还有一个团队,医学的团队认为说,她其实还患有某种皮肤疾病。

所以其实我们普通人都有一定的察言观色的能力,但是我确实在这方面很差,所以得罪了大家的话,请大家见谅。

我们其实有非常多的,比如说我们的销售人员这方面能力就非常的强,更有甚者像我们的老中医,那么他们可以望闻问切,通过望诊来获得一些健康方面的信息。

实际上据我了解,很多的西医也具备这样的能力,特别是我们精神科的医生,看到一个人进了他的诊室,第一眼看过去就会有一个初步的判断,这也是望诊。

我自己相信我们现在这样一个看脸的时代终究会过去,会进入一个读心的时代,读心可以让我们打造有温度、有情商的人工智能的系统,这样的系统可以跟我们人更好的去合作,即使不去在脑子里面移植一个芯片。

从严肃的科学研究的角度来讲,我想介绍一下读心术,它的内涵和外延有哪些内容?

第一个层次就是一些我们通过观察来获得一个人的基本的生理性指标,比如说我们的心率,呼吸率,甚至我们的血压、血氧,当然还包括眨眼视线、瞳孔等等这样的一些特征。

在基础上,我们还可以获得一些短期的特征,比如说我们的情绪,我们的微表情,也包括你开车的时候是不是已经很疲劳?你在上课的时候是不是已经很分心?当然开车的时候分心就更加的危险,这些都是一些心理的状态。

更进一步的话,我们通过观察,医生可以去判断一个人的精神的状态,比如说有没有抑郁,还是非常的幸福。儿童是不是有自闭症,这些其实都是我们可以通过观察这样一种视觉的技术来辅助,甚至是在很大程度上可以去准确判断的。

因为时间关系,我不能展开一一的去介绍,给大家看几个例子,比如第一个,我们有一个工作就是AI可以看得到我们的心跳,我现在其实很紧张,可是谁能够估计出来我现在心跳每分钟的次数是多少次呢?

AI可以做到。

大家仔细看一下,中间这张照片是不是你看到了?不是照片,这是个视频。你看到了他的心跳次数了吗?咚咚咚在跳,在变化,有颜色的变化,我们的心跳会导致我们皮肤上的血流量的一个变化,导致一个颜色的变化。

但是大家不要幻想,其实我们是看不见的,这个视频是做了特殊的处理,把它变化做了增强的。

但是我们通过计算机视觉的技术是可以实现的,去分析这样的一个微弱的信号的变化。

那么这两个视频都展示了黄色的,左边这个黄色的是我们用特殊的设备测出来的,而红色的是我们用一个普通的摄像头,然后加上算法之后估计出来的。右边这也是一样,左边心跳的慢一点,右边是91次,95是血氧。

第二个例子是我们的面部表情和情绪会反映在我们面部肌肉的这样的一些动作上面,我们称之为叫面部动作的检测。那么这方面有心理学家定义了非常多的这样的一些面部的动作。

那么现在通过计算机视觉的技术,我们逐渐的也在提高这样的每一块肌肉动作的一个检测的准确率,左边这个视频也是我们现在做到的一些展示。

我们可能有时候为了跟另外一个人说点悄悄话也很危险,为什么?因为也许在远端有一个摄像头在监控着你,虽然听不到你的声音,但是通过看你的唇部、嘴唇可以估计出来你现在在说什么,这就是唇读的技术。

在这方面我们也有了新的进展,最近我们在跟一些汽车厂商,特别是它在高噪声的情况下,我们可以去获得在语音识别失灵的情况下,通过唇语的识别来提高我们的识别的准确率。

当然你也要小心你的眼神。我们现在有一些技术可以去实现,视频里面的人现在在看哪里?我们可以看到右边的视频是我们现在做出来的结果,我们可以去看这个视频里面这个人,他现在在看哪里在看谁?你


转载请注明:http://www.snzccn.com/jsfl/17756.html

  • 上一篇文章:
  •   
  • 下一篇文章: 没有了