各位,这几天刷爆朋友圈的谷歌AI小程序“猜画小歌 ”,你们都玩过了吗?不知道各位成绩如何,小卡只玩到Level 3就挂掉了,败给了一只桶。或许你会想,画个桶能有多难?是真的难。看似简单的小游戏,其实一点也不简单。例如,AI是如何在你只画一笔的时候,就猜出了它是香蕉?今儿,我们不妨就来参一参,这款小游戏背后所暗藏的大玄机。

你就不想知道自己是如何输掉“猜画小歌 ”的

根据谷歌方面的介绍,“猜画小歌 ”是由Google人工智能的神经网络技术来驱动,该网络源自全世界最大、囊括超过5000万个手绘素描的数据群,机器学习手绘素描后,便能通过粗糙的草图识别出物体,这也是为什么玩家勾勒出简单的线条,AI就可以快速猜出你所画为何物。

实际上,在“猜画小歌 ”问世之前,Google BrAIn就已上线过一款名为名为《Quick, Draw!》的网页版你画我猜,基于一个名为“sketch-rnn”的生成式 RNN,游戏也是随机显示一个名词,要求玩家在20秒内把它画出来,之后Quick, Draw!会判断你画的到底像不像。那么,猜画小歌 用的是何妙宗呢?

“猜猜猜”背后的奥秘

其实,这两款小游戏都使用了神经网络技术,而神经网络是深度学习的基础,最初还是受到生物神经系统的启发,用来模拟生物神经系统而出现的。简单来说,AI通过神经网络来认知世界,且都离不开CNN卷积神经网络或RNN循环神经网络。前者如今已被成功的应用图像识别的各类应用当中,而后者则能利用其内部的记忆处理任意时序的输入序列,因此可以更容易处理如不分段的手写识别、语音识别等。

有了神经网络技术加持,再通过后期大量的涂鸦样本学习猜画小歌 就可总结出不同事物的特征点。当然,除了这些特征点,数据训练也可以给AI动态的画图过程,从而让AI理解人类在画某一个事物时,通常会选择第一笔先画什么、如何走笔以及何时停笔。这就是为什么,有时候玩家刚画第一笔时,“小歌”就能给出正确的答案。因此,用来训练的数据库规模越庞大,AI给出的结果也就准确率越高。

既然如此,那么为何有时候,我们都快将手机屏画满AI还是猜不出正确的答案?原因在于,你是否画出了事物的核心特征。

晋级的关键在于画出“核心特征”

nbsp;就像下面这个梨,当我们画出一个草图后,在草图的下方AI给出了鼻子、大提琴、小提琴多个选项,可唯独没有梨。。。说明在之前画的这张草图里,没有能让AI识别出“梨”的核心特征。因此,不妨多想想别人画梨时,都会画些什么?怎么画才能让 AI 认为你就是在画梨,而非什么提琴、鼻子!

nbsp;又或者,当我们画一条鱼时,画出来的可能是下面这个样子,每个细节都很详细。↓

nbsp;但是,在猜画小歌 观察了大量玩家的手作之后,小歌认为鱼应该是这样的。。↓

显然,就猜画小歌 这个游戏而言,这位玩家的鱼画的太过复杂了。所以,不难发现,除了快速画出物体的核心特征外,最好先勾勒一个大概的形状(或轮廓),毕竟备选答案的数量是有限的,多猜几次小歌总会猜对的。

截止本篇文章发布,小卡已经升至Level 5,最后却败给了“鹦鹉”,AI居然猜它是火烈鸟?请告诉我!我画的哪里不像鹦鹉了!有图有真相↓