谷歌的AI学会了如何画画,但还只是小孩子水平

jopen 7年前
   <p style="text-align:center"><img alt="谷歌的AI学会了如何画画,但还只是小孩子水平" src="https://simg.open-open.com/show/ec14da0658468ac18ba6f65b60116ce3.png" /></p>    <p>谷歌去年推出过一款基于人工智能的网页工具,能根据用户的涂鸦来猜词。目前,这些涂鸦正在被用于指导谷歌的人工智能如何去绘画。谷歌的这项成果名为 Sketch-RNN,目前的绘画水平与婴儿相当。</p>    <p>为了开发 Sketch-RNN,谷歌大脑团队研究员大卫·哈(David Ha)和道格拉斯·艾克(Douglas Eck)从谷歌的工具 Quick, Draw!中收集了 50 万幅用户的涂鸦。每当用户在该应用中进行涂鸦时,应用不仅会记录最终图片,还会记录用户每一笔的顺序和方向。最终数据能够更完整地反映人类是如何绘画的。</p>    <p>最终,大卫·哈和艾克获得了 75 个门类 7 万幅可用于训练的涂鸦作品,包括“猫”、“消防车”、“花园”、“猫头鹰”、“猪”、“人脸”和“美人鱼”。他们的目标是开发出一种机器,能够“以类似人类的方式绘制并生成抽象概念”。这一人工智能系统确实做到了这一点。在利用这些数据进行学习后,系统能根据人类的输入去画画,如下图所示:</p>    <p style="text-align:center"><img alt="谷歌的AI学会了如何画画,但还只是小孩子水平" src="https://simg.open-open.com/show/c593ff48fa998b9cdbabfd2b5e2414cc.jpg" /></p>    <p>根据倒数第二行图片,可以发现,人工智能并不是简单地模仿人工涂鸦的线条。这里作为输入的猫有 3 只眼睛,但人工智能只是提取了概念,而不是涂鸦本身,并且知道 3 只眼睛是不正确的。</p>    <p>随后,Sketch-RNN 还学会了在没有初始输入涂鸦的情况下绘制对象。</p>    <p style="text-align:center"><img alt="谷歌的AI学会了如何画画,但还只是小孩子水平" src="https://simg.open-open.com/show/441c29ccc1cc57325cf9c47379737189.jpg" /></p>    <p>目前,已有一些人工智能系统能生成类似照片、具有真实感的画面。在这样的情况下,为何还要让神经网络学习涂鸦?大卫·哈和艾克表示,尽管涂鸦看起来只是小孩子的玩意,但代表了抽象和数据压缩能力。他们认为,涂鸦“告诉我们,人们如何展现和重建周围世界的画面”。换句话说,涂鸦更富于人文意味。一旦教会人工智能去涂鸦,那么就可以将其应用于多种有趣的用途。Sketch-RNN 甚至也可以用于完成他人画了一半的涂鸦,如下图所示:</p>    <p style="text-align:center"><img alt="谷歌的AI学会了如何画画,但还只是小孩子水平" src="https://simg.open-open.com/show/69ec12d6ff35551813eced989b3162a6.jpg" /></p>    <p>此外,Sketch-RNN 还可以将不同涂鸦合并在一起。在下方的图片中,这一神经网络被要求绘制“猫”和“椅子”合并后的东西。最终结果是奇怪的四不像。</p>    <p style="text-align:center"><img alt="谷歌的AI学会了如何画画,但还只是小孩子水平" src="https://simg.open-open.com/show/803ae88b64da64bd48018e60ff58e4e5.jpg" /></p>    <p>Sketch-RNN 还可以用于绘制所谓的“隐藏空间插入”:观察任意数量的涂鸦对象,以不同比率将这些对象合并在一起,创造出包含多个元素的新涂鸦。在下图左侧的涂鸦中,这一人工智能合并了 4 种不同的涂鸦:猪、兔子、螃蟹和人脸。</p>    <p style="text-align:center"><img alt="谷歌的AI学会了如何画画,但还只是小孩子水平" src="https://simg.open-open.com/show/49910e9501cc6140e9ac556e65d5b7fc.jpg" /></p>    <p>很明显,这样的涂鸦非常基础,但用于绘制这些涂鸦的方法很有趣,也很有用。未来,类似 Sketch-RNN 的人工智能系统可以作为设计师、建筑师和艺术家的创意助手。如果某人对自己的绘画或设计不满意,那么可以让人工智能去总结当前的成果,进而提出更多建议。计算机生成的图像自身可能没有太大用途,但可以给人类带来灵感。</p>    <p>来自: <a href="/misc/goto?guid=4959005933732439009" id="link_source2">腾讯科技</a></p>