第五讲
从机器学习到学习机器:智能算法的心之所向
模型定义下的人脸识别:四个参数画大象
为了解决手工明确构造规则来进行人脸检测的不足,基于统计建模的机器学习方法被提出。用模型定义这种方法来识别人脸就是从构成人脸的数据出发来预先设计一个统计模型,通过判断要识别的东西是否与已经建立的人脸统计模型相匹配,来完成人脸识别任务。统计模型包含了数目不一的参数,需要通过不同方法来优化和学习,使得模型更好地完成任务。
这里出现了统计模型这一术语,统计指的是“统而记之”,即将数据统合到一起,来设计可产生数据的模型,从而完成计算。1985年11月,一位美国学者在英国牛津大学图书馆找到了一首诗,引起了此诗是否为莎士比亚所作的争论。论战两个月后,1986年1月美国《科学》(Science)杂志发表了一篇文章,题目是“莎士比亚的新诗:向统计学致敬(Shakespeare's new poem: an ode to statistics)”,文章中介绍了研究人员统计分析了莎士比亚作品和非莎士比亚作品中遣词造句的习惯,发现这首诗与莎士比亚写作风格一致,鉴定这首诗为莎士比亚所作,从而平息了这场争论。这个故事中,莎士比亚作品中遣词造句的风格就相当于一个统计模型。总结一下,为了让机器完成某个任务,可以为这个任务设计一个模型,观察数据是否能从模型中产生,好比“授之以鱼、不如授之以渔”。
一旦模型确定,需要参数来刻画模型。原子能之父费米(Enrico Fermi)曾经讲述过如下故事,他说冯·诺依曼(John von Neumann)曾经对他说过,用四个参数就可以画出一头大象,用五个参数就可以让大象鼻子动起来。更有趣的是,在2010年,三位德国科学家利用复数思想,还真用四个参数画出了大象,然后用五个参数让大象的鼻子动了起来。这说明从数据中找到模型本身以及合适参数,精确刻画数据产生模式,从“鱼”到“渔”,难能可贵。
回到人脸识别这个任务上来,在基于统计建模的人脸识别学习中,可以定义一个模型来刻画构成人脸的像素点数据产生机制,解释为什么这些像素点按照模型预设模式就可以生成一幅人脸。给定一幅未知的人脸图像,可以去判断构成这幅人脸图像的像素点是否符合已定义模型,从而完成识别任务,就好比去分析作品中遣词造句使用模式是否与莎士比亚写作习惯一致,来完成莎士比亚作品鉴别一样。
14,15两节的内容放反了