德国科学家给电脑点亮了画画技能树，结果有点魔性

漂亮的石头 · 2015-09-02

如何评价德国计算机神经网络科学家发表的这篇可以让电脑模仿任何画家的风格作画的论文？

文章的 arXiv 链接：http://arxiv.org/abs/1508.06576

王峰

有电脑了，就好好回答一下这个问题。

究竟什么叫做风格？这很难给出一个数学上的定义，但有两点特性是可以确定的：

一是风格的表达应当是局部的。Receptive field 越大，特征越接近语义，即"这个东西是什么"，而不是风格，当然也不能太小，因为风格这东西还是个比较复杂的模式 (pattern)。

二是全局共享同一个风格，如果各处都是不一样的，那就变成大杂烩，而不能称为具有某种风格。

说到这里，对卷积神经网络比较熟悉的可以想到，中层的卷积特征符合这两个特性。在我们还未明确什么是风格这个特征的时候，可以找一个比较大的网络（例如 VGG），将中层卷积特征的分布当做风格。

这篇文章主要解决了两个问题：

第一个问题是如何能同时保证生成的图像还像原来的东西，即“这个东西原来是什么，现在还是什么”。之前说过，这个在学术界有个名词叫做语义 (semantic)，处在神经网络的高层中。因此原图和结果图的高层语义特征之差应尽量小。

第二个问题是“风格”这个 pattern 到底是什么，文中的答案是所有卷积层的特征 Orz……这跟我们上边分析得到的“中层特征”不是很相符，高层特征会带来一些具体的物体，比如梵高星空中的大漩涡（抱歉我真不知道这是什么），窃以为这个具体的物体不叫风格。

为了实现平移不变性，作者使用了所有空间位置上，特征的协方差矩阵来衡量特征的分布。通过减小原图和风格图的特征分布之间的差距，使得原图和风格图的风格尽量接近。

上边提到了两个“减小”，对应着两个损失函数，通过优化，即可得到文中所示的结果。

这篇工作是开创性的，即找到了新的应用，所以很值得肯定。希望大神们多多研究，将神经网络绘画发展成一个单独的方向，就不会再有人问“这东西能不能提高识别率”这样的问题了。

下面回答一下题主的问题：

1. 此程序或算法是否一种革命性的新成就，或者只是现有技术的复杂化？

答：不能算革命性的成就，“什么是风格”的问题还是没解决，而是用了一种很暴力的方式。

2. 此技术的发展前景如何，程序是否有一天会发展到可以脱离模仿，自己创造画风独立创作?

答：我觉得是可以的，上文提到的特征分布，其实没必要来自于一幅现有的名作，里面的内容是可以随意修改的。不过，这么做符不符合人类的审美观，就没法保证了。一个可行的办法是大量地随机，让人们来对生成的图像进行打分，然后从里面学习出“什么是美观的风格”。

3. 从美术角度看，画的艺术价值如何？

答：我们程序员、科研人员这些死理性派，来评价艺术价值，显然是不合适的。

4. 这项技术今后的大规模发展，是否会导致一些画家失业？（这里指的不是顶尖的有自己风格的大师，而是水准相对平庸的画匠。）

答：这个问题也不在我的回答能力范围之内。

5. 这程序有下载或在线版么？如果能找到的话求衔接。

答：这里有一份代码，不过非神经网络研究人员应该跑不起来：

kaishengtai/neuralart · GitHub

以 Stanford 的速度，估计本月内会有在线 demo 吧，之前 Inceptionism 风靡那会，还有人在油管上边直播生成过程 Orz

查看知乎原文

登录或注册

德国科学家给电脑点亮了画画技能树，结果有点魔性

漂亮的石头版主管理成员

登录或注册

德国科学家给电脑点亮了画画技能树，结果有点魔性

漂亮的石头 版主 管理成员

漂亮的石头版主管理成员