刷屏的AI作画,背后的技术是什么?(上)
让机器有创造力,一直是人工智能的最高理想之一。所以,生成任务就成了衡量机器创造力的标准。这些生成任务既包括生成文字(问答、对话、诗歌、小说),也包括生成图片和视频。在本期,我们就将介绍一下最近刷屏的人工智能作画背后的技术。

图片来源:pixabay
一、对抗式网络模型(GAN)的诞生
直到几年前,AI在生成任务上的表现都很糟糕。它们要么严格按照模板和规则复述,要么只能天马行空地胡言乱语。直到对抗生成网络模型的诞生,我们才能既让人工智能产生创意,又能让这些创意的质量得到控制。对抗生成网络英文简写是GAN。
它包括了一个生成器(G)和一个对抗(分类)器(A)。生成器需要不断训练自己,得到逼真的图片,骗过分类器;而分类器则要尽量将生成的图片和真实的图片区分开来。
GAN的作者伊恩·古德费洛(Ian Goodfellow)在原始论文里用一个假想的警察和假钞犯来举例子。分类器是警察,生成器是假钞工厂。一开始警察只会通过大致的图案分辨真假钞票,所以假钞工厂只要印出钞票的主要图案就能蒙混过关。为了解决假钞问题,警察开始检查钞票上的底纹、微缩文字和水印。于是,一大批无法仿造出带有这些特征的假钞工厂只能关门大吉,而剩下来的钞票显然伪造能力更强,也能造出更逼真的钞票。为了继续分辨出这些假钞,警察们发现这些假钞的用纸和真钞有所不同,手感也不一样,于是做假钞的人又要开始琢磨如何更精确地配比模仿真钞纸浆的化合物比例,做出手感一样的钞票……以此往复,验钞机的能力越来越强,但也在让假钞机的模仿能力变得更强。
二、在对抗中“学习”
具体来说,GAN中的生成器和分类器是两个神经网络。神经网络是机器学习中的一种基本技术,可以把它理解成一种“机器”:在吃进一个需要处理的数据后,吐出我们想要得到的结果。如果我们想要判断图片是狗还是猫,吐出的结果就是一个数字:1(代表狗)或0(代表猫);如果我们想要用人工智能翻译,输入是一种语言的文字,输出就是另一种语言的文字。
在未经训练的时候,神经网络只能输出完全不靠谱或随机的结果。但如果能找到大量已知正确输出的数据,就能让神经网络得到训练,从而得到正确答案。我们把这一过程叫做“学习”。GAN的分类器也有类似的机制,可以分辨一张图片是真的还是生成的。而生成器则能根据一个数字或向量生成一张图片。
刚开始的时候,生成器没有任何目标,只能生成随机的数据,例如模糊的影像甚至是一些纯粹的噪音。分类器可以经过简单的训练后,就能轻松地区分这些糟糕的图片和真实的图片。这时,生成器就要训练自己,尽量骗过简单的分类器。
随后,这一过程会不断重复。首先,分类器要学会如何辨别出增强版生成器吐出的图片,而生成器也要改进自己,从而骗过增强版的分类器。如此迭代数万乃至数十万次,生成器就能变得强大起来,生成较为逼真的图片。
虽然原理比较简单,但GAN的训练非常困难。在原始的GAN论文中,生成的图片其实质量也不高。但随后大量研究团队从不同方向上做了改进,让GAN产生了很多变体。其中,相当有名的是StyleGAN,它能生成极为逼真的人脸。这些人脸和任何已有的人脸都不相同,是由计算机全新创作出的面孔。

作为图片生成模型,GAN仍然有很多缺点。首先,GAN训练时很不稳定,有时整个模型都会在训练中崩溃。其次,不同的场景需要训练不同的GAN模型:如果想要生成猫的图片,就需要找一大堆猫的照片用于训练;如果要生成人脸的图片,就要想办法搞到大量人脸的图片。
但需求的种类是无限的,有些场景也会非常复杂,比如“我想生成一只猫在追一条狗”,这样的需求就很难通过GAN来解决。或者说,GAN只能理解专门用于某个场景的训练图片数据,而无法理解人类的语言,因此不能通过文字控制图片的生成。这两个问题被OpenAI的DALLE模型很大程度上解决了。我们将在下期视频中详细地介绍。
文章由科普中国-星空计划(创作培育)出品,转载请注明来源。
作者:管心宇 科普作者
审核:于旸 腾讯玄武实验室负责人
标签:
73
一瓶啤酒和白酒对比(一瓶啤酒里面有多少白酒) 一瓶啤酒和白酒对比,一瓶啤酒喝下去,肚子里的酒精含量大概是0.5毫克,而一瓶白酒的酒精含量大概是0.8毫克,差不多是一瓶啤酒的三...
147
适合创业的低投资的小项目,适合穷人的18个创业项目投资小的有哪些 提起适合创业的低投资的小项目,大家都知道,有人问有什么投资少,风险小适合普通人的创业的项目呢?,另外,...
89
指数型基金哪个好一点(沪深300指数型基金哪个好) 指数型基金哪个好一点?这个问题其实很好回答,因为不同的基金有不同的特点,比如指数型基金就是一种追踪标的指数的基金,而债...
91
山楂卷的制作方法,山楂卷吃了感觉有酒味儿,是坏了吗?但是还没过保质期呢? 山楂卷吃了感觉有酒味儿,是坏了吗但是还没过保质期呢 因为胃酸分泌不足,每次进食后总感觉堆积...
97
老鼠为什么会飞(会飞的老鼠千万别轻易养) 鼯鼠, 因为会“飞”回到自己主人的手上, 收获公众大量喜爱。 它们皮毛柔软, 水汪汪的大眼睛晶莹剔透, 全身一般只比我们的手掌大一...
95
大竹林,重庆的大竹林区域适合宜居吗? 重庆的大竹林区域适合宜居吗 重要的事情说三遍,只要自己喜欢住着舒适,开兴,哪里都适合宜居。 只要自己喜欢住着舒适,开兴,哪里都适...
68
刚交往可以接受aa制吗,情侣之间到底应不应该AA制 “通常来说,刚谈恋爱的男生是不好意思让女朋友付钱的吧?” 最近收到的读者私信中有这样一个问题,“怎么说呢,也不是说女朋...
171
周杰伦身价多少亿(周杰伦身价多少亿2025) 前段时间有女演员曝光一部剧的片酬高达1.2亿。这个爆料瞬间爆了微博朋友圈。一个演技零、素质低的艺人,身价这么高,太不公平了。 最...
116
阎王注定寿数一览表(阎王注定寿数一览表图) 大家好,近期很多朋友对于 阎王注定寿数一览表 产不是很理解。然后还有一些网友想弄清楚阎王注定寿数一览表图,(www)已经为你找...
62
在KTV被男朋友兄弟上,男友与我分居两地,我一个人时常感到寂寞 我28岁,有一个以结婚为前提交往的男友,在一起相处半年,感情很好,男友对 我很好 ,简直可以说是千依百顺,但...
194
吴京为什么现在不拍战狼3(战狼3或已开机演员阵容强大) 要说起近年来国内人气最高的演员,非吴京莫属! 2015年,由吴京自导自演的中国首部当代战争实战大片,筹备拍摄长达7年之...
127
简单的绘本儿童画(创意儿童画教程) 课程类型 综合创意画 参考课时 90分钟 工具材料 油画棒、彩色卡纸 课程构思 梨子是小朋友们非常熟悉的水果,美味的梨子鲜嫩多汁,在夏天咬上...
163
这8种多肉竟然有毒!家里有老人小孩的注意了! 银冠玉 为啥有毒? 花花首先来说的,就是被警察叔叔查获的银冠玉了!银冠玉的体内含有一种叫做墨斯卡灵的生物碱,如果不小心误食...
140
四川大学什么专业好,四川大学女生学什么专业好? 四川大学女生学什么专业好 四川女大学生可以学护理,幼教,设计,酒店管理等专业 四川大学有什么优势专业 四川大学最好的专业...
151
骑士vs火箭原声第二节(骑士vs火箭推荐) 在骑士VS火箭比赛的第二节,两队爆发出了激烈的对攻。火箭队发挥出优秀的进攻战术,成功地命中了一系列的三分球,让比分扩大到了两位数。...
145
女人出轨表现在几方面(往往难逃这4个表现) 如果一个女人出现这4个表现,往往说明外面有人了,特别准 前言: 一段婚姻中,男人出轨已经不足为奇了, 但随着社会的发展女人也变...
135
“全班女生都暗恋我”,高中生苦恼无心学习,去趟医院后尴尬了 头条创作挑战赛 进入青春期后,学生们开始在意自己的外表,也开始对异性产生好奇,其实只要不越界,这种青春期...
198
冰箱漏水(冰箱漏水会触电吗) 1、那么冰箱漏水是什么原因呢下面我们一起来分析下可能的原因1冰箱门无法紧闭造成漏水2,冰箱内排水道堵塞或冰冻造成漏水3冷冻区无法结冻造成漏水...
76
一份百发百中的邀约女生指南! 今天分享一个邀约女生的套路,干到不行的干货,值得收藏! 很多哥们说,邀约有什么难? 不就是说:hey,周日有时间吗?一起吃个晚餐! 可是,她会...
174
看了《男人来自火星》发现,让男人上瘾的女人,都懂得这些套路 男人来自火星,女人来自金星》这本书讲述了男女之间的差异,不仅仅是简单的生理构造,更多的是思维方式和认知的...