人工智能的世界是什么样的?

几十年来,研究人员一向对此认为困惑。如今,人们加倍想知道这个问题的谜底。尤其是,从医疗保健到主动驾驶汽车,越来越多的生活范畴开端应用机械视觉体系。并且这些范畴直接和人的生命互相干注。

然则让机械眼睛真正“看到”谁是行人谁是路标,仍然是一个挑衅。做不到这些可能会产生严重甚至致命的后果。

如今,谷歌和有名人工智能研究机构 OpenAI 的一项新研究有望改变这种情况。他们正经由过程绘制一些体系来感知世界的视觉数据,从而进一步打开人工智能视觉的黑匣子。这种被称为“Activation Atlases”的办法让研究人员可以分析各类算法的工作道理,不仅揭示了他们识其余抽象外形、色彩和图案,还揭示了他们若何将这些元素结合起来辨认特定的物体、动物和场景,堪称在计算机视觉范畴又一次重要的打开黑箱的测验测验。

这感到像是创造了一个显微镜。”这项工作重要负责人、来自谷歌的 Shan Carter 如斯说道。

图丨用 Activation Atlas 处理 GoogLeNet 视觉算法的一系列模板(图片:Google / OpenAI)

假如将先前的研究比作视觉算法字母表中的单个字母,那么 Activation Atlases 则更接近于全部字典,它显示了字母是若何组合在一路构成实际单词的。

这项工作不必定是一个巨大年夜的冲破,但它在“特点可视化(feature visualization)”这一更广泛的研究范畴中向前迈出了一步。佐治亚理工学院的博士生 Ramprasaath Selvaraju 没有介入这项工作,他表示,这项研究“异常令人入神”,它结合了很多现有的设法主意,创造了一个新的“异常有效”的对象。

然则,Activation Atlases 实际上向我们展示了算法内部运作方法的什么内容?你可以先在谷歌和 OpenAI 的例子中进行懂得,它们能为我们展示有名的 GoogLeNet(也叫 InceptionV1)神经收集的内部世界。

Selvaraju 表示,在将来,如许的工作将有很多用处,它可以赞助我们建立更高效、先辈的算法,还能让研究人员进入内部来进步算法的安然性并清除算法成见。Selvaraju 说:“因为神经收集固有的复杂性,它们缺乏可解释性”。但他表示,在将来,当神经收集经常用于驾驶汽车和引导机械人时,这种解释性将是须要的。

但对于 Carter、Olah 和其他研究人员来说,Activation Atlases 和类似对象所揭示的信息显示了这些算法的惊人深度和灵活性。例如,Carter 指出,为了使算法区分带水肺潜水员和潜水员,它还将不合类型的动物与这两个类别接洽起来。

OpenAI 的 Chris Olah 也介入了这个项目,他说:“至少,这就是我们所寻求的目标。“

图丨 Activation Atlases 能让研究人员描述算法用于懂得世界的视觉数据。(来源:OpenAI / Google)

激活神经元

AI 体系辨认对象的根本办法是应用神经收集:一种与人类大年夜脑大年夜致类似的计算构造(它在复杂性方面远远落后于人脑)。在每个神经收集内部是一层像网状物一样连接的人造神经元。像人类大年夜脑中的细胞一样,这些神经元会响应刺激,这一过程称为激活。重要的是,它们不仅可以开启或封闭,它们还会在光谱上注册,并为每次激活付与特定值或“比重”。

要将神经收集变为有效的器械,用户必须供给大年夜量的练习数据。以视觉算法为例,这将意味着数十万甚至数百万的图像,并且每个图像都要标记有特定的类别。而谷歌和 OpenAI 的研究人员测试的神经收集,练习数据则加倍广泛:几乎所有器械都有涉及。

如今的人工智能是一个有局限的对象箱,”Olah 说。他表示,我们可以在体系上用测试数据来试图欺骗它们,但这种办法老是受到我们的认知限制。“Activation Atlases 给了我们摸索未知问题的新对象,感到每一代人工智能对象都让我们更接近真正懂得这些神经收集中正在产生的工作。”

图丨神经收集应用一层互相连接的人工神经元来处理数据。不合的神经元对图像的不合部分起感化(来源:OpenAI / Google)

当神经收集处理数据时,神经收集中的不合神经元会因响应不合图像而亮起,并经由过程这种模式连接到图像的标签。恰是经由过程这种接洽关系,神经收集才能“进修”事物的样子。神经收集经由练习后,用户就可以向它展示以前从未见过的图片,并且能激活神经元,然后将用户的输入与特定类别相匹配。

然则,像很多机械进修法度榜样一样,视觉算法本质上只是模式匹配罢了。这给了它们必定的优势(例如,只要你拥有须要的数据和计算才能,就可以直接进行视觉算法练习)。但它们也有某些弱点,例如它们很轻易被之前从未见过的输入陷入纷乱。

研究人员在 2010 岁首年代发清楚明了神经收集在处理视觉义务方面的潜力,他们一向在完美相干研究,试图弄清楚神经收集是若何做的。

后来的研究采取了同样的根本办法,并对其进行了微调:起首针对神经收集中的单个神经元,并弄清楚是什么激发了它们,然后是神经元群,之后是神经收集中不合层的神经元的组合。假如早期的实验是有时但专注的,那么比来的工作更有针对性。经由过程绘制神经收集的每个部分中激活的视觉元素,积少成多,最终就获得了全部图集:神经收集的视觉索引。

早期的一项实验是 DeepDream 法度榜样,这是 2015 年宣布的计算机视觉法度榜样,它能将任何图片变成幻觉版本。DeepDream 的视觉后果肯定是有趣的,比如在某些方面,它定义了人工智能美学,但该法度榜样也是算法的早期测验测验。“某种程度来说,这一切研究都始于 DeepDream 法度榜样,”Olah 说。

图丨像 DeepDream 如许的图像让机械进修算法尽可能有趣(来源:OpenAI / Google)

DeepDream 所做的是将图像调剂为尽可能有趣的算法。这就像是软件在图像中发明“隐蔽”的图案,又更像是有人在着色书中涂鸦:用眼睛,画笔,螺纹和颜料填充每一寸画纸。

(来源:OpenAI / Google)

机械的视角

测试地址:https://distill.pub/2019/activation-atlas/

滚动鼠标,您可以看到神经收集的不合部分若何响应不合的概念,以及这些概念若何集合在一路。(例如,狗和鸟类在不合的处所)你还可以看到神经收集的不合层代表不合类型的信息。较初级其余神经层相对抽象,响应根本的几何外形,而较高等其余神经层将解析可识其余概念。

当你深刻研究个别分类时,就会变得有趣。谷歌和 OpenAI 给出的一个例子是“潜水管”和“潜水员”之间的差别。

鄙人图中,你可以看到神经收集用于辨认这些标签的各类激活活动。左边是与“潜水管”密切相干的激活响应,右边是与“带水肺的潜水员”密切相干的激活响应。中心的激活响应在两个类之间共享,而条纹上的那些则有更多的差别。

图丨与“潜水管”(左)和“带水肺的潜水员”(右)相干的激活响应。(来源:OpenAI / Google)

我们可以一目了然地看出一些明显的色彩和图案。在顶部,看起来像鱼的鲜艳斑点和条纹,而在底部,有看起来像是面具的外形。但右侧凸起显示了一种不平常的激活响应,与蒸汽机车密切相干的激活响应。研究人员对此认为困惑,为什么这些关于机车的视觉信息对辨认潜水员很重要?

“所以我们测试了它,”Carter 说。“我们想,'好吧,假如我们输入一个蒸汽机车的图片,是不是会辨认为带水肺的潜水员图片分类或潜水员分类图片?'如今看来确切如斯。”

该团队最终找到了原因:这是因为机车的滑腻金属曲线在视觉上类似于潜水员的空气罐。是以,对于神经收集来说,这是带水肺的潜水员和潜水员之间的一个明显差别。为了节俭区分这两个类其余时光,它只是从其他处所借用了所需的辨认视觉数据。

要懂得 Activation Atlases 和其他功能可视化对象的工作道理,起首须要懂得一下 AI 体系是若何辨认对象的。

图丨三个图像显示了若何从新分类雷同的图片。在左边,它被肯定为潜水员分类; 中心,跟着机车图片的增长,它变成了带水肺的潜水员分类; 当机车足够大年夜时,它变成了机车分类。(来源:OpenAI / Google)

这种例子出人不测埠揭示了神经收集的运作方法。而对于困惑论者,它揭示了这些体系的局限性。他们表示,视觉算法可能是有效的,但他们学到的信息实际上与人类若何懂得世界无关。这使他们轻易受到某些诡计的影响。例如,假如将一些精心遴选的像素投射到图像中,可能就足以使算法对其进行缺点分类。

“在深水中像海龟一样的动物,被分为 scuba 类,地面上出现的鸟类一样,被分为 snorkel 类,”他说。他指出,这是体系从未指导进修的信息。相反,它是自学的。“这有点像是神经收集对世界更深刻的懂得。这真的很令人高兴。“

研究人员欲望经由过程开辟如许的对象,将有助于推动人工智能全部范畴的成长。经由过程懂得机械视觉体系若何对待世界,理论上我们可以更有效地构建它们并更彻底地检查它们的精确性。

-End-

编辑:李亚山 责编:黄珊

参考:

https://blog.openai.com/introducing-activation-atlases/

声明:该文观点仅代表作者本人,南宁资讯网系信息发布平台,本站仅提供信息存储空间服务。