现任斯坦福大学工作的计算神经学家 Daniel Yamins 表示,一个像大脑那样对场景进行分层处理的神经网络,可以与人类在识别物体方面的机制相映射。
同样的,研究人员已经证明,最擅长分类语言、音乐和仿造气味的深度神经网络,其结构似乎与大脑的听觉和嗅觉系统是类似的。这种相似之处也在另一类深度神经网络得到了体现:它们可以仅通过观察 2D 场景就推断其中的 3D 对象的潜在属性。该发现有助于解释生物感知为什么既快速又丰富。这些结果表明,生物神经系统的结构对它们所承担的任务具有某种独到的最佳解决方案。
它从描述要在背景上渲染的人脸的参数开始,例如形状、纹理、光照方向、头部姿势等等。一个被称为生成模型的计算机图形程序根据参数创建一个 3D 场景,然后,经过不同阶段的处理,它会产生一个从某个位置观看的该场景的 2D 图像。利用生成模型中的 3D 和 2D 数据,研究人员训练了一个改进版的 AlexNet ,来从一个不熟悉的 2D 图像中预测 3D 场景的可能参数。