来自 科技 2020-12-18 09:47 的文章

dnf纵火犯本汀克在哪误把光头当足球 AI视力差不仅仅因为训练少

  近几年,人工智能发展迅猛,应用领域不断拓展。但在各领域大展身手的同时,AI“翻车”案例也频上热搜,基于此,本版今开设“AI·成长的烦恼”栏目,聚焦AI“翻车”的那些事儿,剖析现象、分析原因、探讨解决之道,同时期待它的成长。

  球赛结束后,球迷要求裁判戴帽子或假发,大概是史无前例了。

  10月底,苏格兰球迷经历了一场“难忘”的足球赛。在因弗内斯对阵艾尔联的苏格兰足球冠军联赛上,无论球员传球还是带球进攻,场边的AI摄像机都视而不见,反而不离不弃跟着一名边裁,时不时来张“C位”特写。原来,AI摄像机误将这名裁判的光头识别成足球,所以疯狂追了一整场。

  在家观看这场90分钟比赛的球迷,大部分时间不是看球,而是在围观光头。不少网友打趣:这场球赛实打实地“看了一个寂寞”。

  为什么AI摄像机会把光头看成了足球?为避免AI犯类似失误,我们需要做些什么?出现“翻车”事件,能就此认为AI“弱爆”了吗?

  来自光头裁判的无意识“挑衅”

  从直接参与体育赛事到记录运动员表现,再到直播比赛现场、分析运动员健康状况,AI正成为体育界的宠儿。几个月前,巴塞罗那足球俱乐部(巴萨)还携手视频技术公司Pixellot,打造了人工智能教练解决方案。

  没想到,在体育界一路高歌猛进的AI,这次出人意料地遭遇了一名光头边裁无意识的“挑衅”。由于这名边裁光头太亮,加之阳光照射,AI摄像机根本分不清哪个是球,哪个是头。此前,因弗内斯队表示,他们使用的AI跟踪技术,可以将直播画面清晰地传输到每一位季票购买者家中,让因新冠肺炎疫情而无法前往主场的球迷不错过任何一场比赛。

  据悉,此次比赛直播使用的摄像机正是与巴萨合作的Pixellot所提供的多摄像机系统。该系统由英伟达的图形处理器(NVIDIA GPU)提供动力支持,捕获的视频分辨率可达8K。这些摄像机可以安装在固定位置,无需摄像机操作员进行操控。为捕获关键时刻画面,Pixellot收集了数十万个小时的体育视频,用于在本地工作站的NVIDIA GPU上训练其算法。

  拥有海量的可用数据,使用了深度学习算法,加上高性能GPU计算加持,具备推动AI前行的三大动力,Pixellot的这款AI摄像机为何“翻车”呢?

  活动结束后,相关俱乐部和制造摄像头的技术公司进行了反思,问题似乎非常清楚:足球的大小、形状与人的脑袋差不多,加上阳光直射,让AI摄像头陷入了“迷茫”。因弗内斯队回应称已知晓了问题,并且将为下一场比赛进行改进,给观众带来更好的体验,希望这种情况不会再发生。

  Pixellot公司也表示解决这个问题并不难。现有的目标检测与追踪技术已比较成熟,Pixellot在设计阶段没考虑到光头的影响,需要收集一些足球和光头的数据对算法进行微调,以排除来自光头的干扰。

  有技术人员表示,在训练直播球赛的AI摄像机时,需要的不仅“这是球”数据集,还需要一个“这不是球”数据集。光头、足够亮的白鞋、灯光、比赛场地旁训练场上的球、球员用来热身的球,都是训练AI时需要考虑的干扰因素。

  AI“视力差”才是常态

  尽管可以通过加大数据“投喂量”,加强训练和改进算法改善AI摄像机性能,但有专业人士认为,随着AI应用场景逐步拓展,此类“翻车”事件还将长期存在。

  “AI‘翻车’是常态,不‘翻车’才奇怪。”北京大学信息科学技术学院教授、北京智源人工智能研究院院长黄铁军接受科技日报记者采访时直言。

  黄铁军认为,表面上看,这次AI摄像机出现失误可能是因为前期训练不够,但最主要的原因是现在的计算机识别系统还只是用特定的数据训练出来的,例如在上述例子中,使用大量足球视频训练的神经网络在识别足球方面已超越人类,但却忽视了这个网络对光头更敏感,对

  没见过的对象胡乱识别或“视而不见”,这种问题普遍存在。

  机器视觉就是将视觉感知赋予机器,使机器具有和生物视觉系统类似的场景感知能力,涉及到光学成像、图像处理、分析与识别、执行等多个组成部分。

  “把摄像机作为AI的‘眼睛’,在现实场景中,让AI像人眼一样去识别足球和光头,还有很长的路要走。”黄铁军表示。

  什么时候能走完这条路,甚至实现AI之眼超越人眼?

  这取决于机器视觉何时弥合与生物视觉的差距。“颅骨之中的大脑通过三百多万根神经纤维实时感知外部世界,其中每只眼睛后面就有一百多万根。”黄铁军表示,“发展至今天的机器视觉,与花费亿万年进化而来的生物视觉系统相比,还是小巫见大巫。”

})();