字做生成,我们也在尝试一些事情。 当时有一些关于生成的论文,我们也在思考如何生成。 实际上,如果你从概率分布的角度来看,数学上是可以进行生成的,只是当时生成的东西根本无法让人感到惊艳。所以,尽管从数学理论上来看生成的概念是存在的,但实际上没有任何生成效果让人感到满意。 然后我想特别提到一位博士生,他在深度学习方面有着浓厚的兴趣
来到了我的实验室
这个博士生的整个博士学习经历几乎可以 说是这个 阿联酋电子邮件列表 领域发展轨迹的缩影。 他的第一个项目是数据,我逼着他做,尽管他不喜欢,但事后他也承认学到了很多有用的东西。“现在我很高兴你能这么说。”于是我们转向深度学习,核心问题是如何从图像生成文字。实际上,这个过程中有三个明确的阶段。 第一个阶段是将图像和文字进行匹配。我们有图像
也有文字
接下来我们要看它们之间的 你可以重复弹奏不同品 关联度。我的第一篇学术论文,也是我的第一篇博士论文,研究的就是基于场景图的图像检索。接下来,我们继续深入研究,从像素生成文字,这方面他和 Andrej 都做了很多工作,但依然是一种非常有损的生成方式,信息从像素世界中获取时损失很大。
中间阶段有一个非
常著名的工作,那个时候有人第一次实现 AFB 目录 了实时化。05 年,一篇叫《神经算法的艺术风格》的论文由 Leon Gatys 领导发表。他们展示了将现实世界的照片转换为梵高风格的图片。 我们现在可能习以为常,但那是在 05 年,那篇论文突然出现在 Xiv 上,震惊了我。我感觉大脑中被注入了一种“生成 的病毒”。我心想:“天哪,我需要理解这个算法,玩一玩,试着把自己的图片变成梵高风格。” 于是,我花了一个长周末重新实现了这个算法,让它能够正常运行。其实它是一个非常简单的算法,我的实现大概只有 300 行代码,当时是用Lua写的,因为那时候还没有 ,我们用的是 。不过尽管算法简单,它的速度很慢。