从万物有灵到AI掌管世界——AI视野（三）-集智俱乐部的财新博客-财新网

文 | 张江

导语

据统计，到2020年，接入互联网的设备将会突破五百亿。

于是，如何有效地管理如此数量巨大的电子设备将成为一个棘手的问题。尽管配备了深度学习功能的神经芯片将会嵌入到这些设备之中，使得万物有灵不再是神话，但人类有限的认知资源仍然无法细微的关注到每一个智能硬件。我们必须借助人工智能，一个由AI管理的世界将不可避免地到来……

人工智能＋智能硬件

人工智能这个词虽然已经火热，但是AI技术的落地仍然是一个重大而未解决的问题。如果你已经读过我的AI视野系列的上一篇文章：解析深度学习，畅想未来应用，就不难了解到，这一波人工智能革命所仰仗的深度学习技术实际上是一场界面革命。语音、图像、文本识别与理解等技术的深入发展，将使得人与机器之间的互动变得更加多元化，更加自然、顺畅。

最近，亚马逊出品的爆款：智能音箱Echo就是一个很好的人工智能落地产品。你不仅可以用它来播放任何你想要类型的音乐，还能够用它来链接第三方服务接口，来完成订购外卖、健身等应用，甚至在你无聊的时候还可以跟它闲扯两句。

出门问问是一家中国的人工智能公司，曾获Google投资。他们主打的产品就是这款称为Ticwatch 2的智能手表。戴上它，你不仅可以和它自然地交谈，而且你还拥有了整个互联网，因为它可以自动地帮你搜索答案。

这还仅仅是开始，接下来，智能硬件、智能家居、物联网等概念会再次袭来。然而，就在两年前，智能硬件还遭遇过滑铁卢，为什么呢？我认为这里的关键就在于这些智能硬件都缺乏人工智能。

记得有一次，有人送我一个智能插座让我体验。我本想好好玩一下，却发现必须先要安装一个APP还有一大堆的设置，于是我果断把它扔到了一边。我是一个时间极度缺乏的人，哪还有时间去为了一小小插座安装APP？正是因为智能硬件很多都是小物件，它所隐藏的时间成本才会很高，我们不值得花费大量的时间去指挥它，所以人工智能对于这些小硬件来说，才是至关重要的技术。

从另一个角度说，这些智能硬件会为人工智能的落地提供舞台和应用场景。设想一下，当我把那个智能插座接上电以后，它会用流畅的中文跟我聊上几句，完成繁琐的设置，同时还能依据我的心情变换颜色，智能地帮我进行节能省电，那么我一定会爱上这个插座的！所以，硬件和人工智能简直就是天作之合。

端－云模式

目前的人工智能硬件主要依赖一种端－云模式。端就是智能硬件／智能终端，它解决了人工智能算法触及到每一个用户的能力；而云就是指存储人工智能算法的区域，它为每一个硬件添加了超级强大的计算能力。甚至我认为这样一种端－云模式会朝着小与大的两级发展。

所谓的小就是说承载智能的硬件会越来越小，越来越不起眼。以后，可能一把钥匙，一个纽扣都是一个端。而大则是指成千上万这样的设备会链接到云端的人工智能服务器。通过大量的端收集得到海量数据传输到云，驱动着人工智能算法能够快速地挖掘出适合每个用户的个性化服务模式。

万物有灵

然而，这种端－云的模式显然也并非完美，最主要的问题是端与云之间差着一个网。智能服务经过网络延迟后就会大打折扣。人们正在尝试新的途径。

一种途径就是赋予每个端更强的计算能力。一旦我们将承载了深度学习的专有芯片装进了每一个智能端，那么端就可以在本地拥有强大的人工智能能力。

英伟达乘着人工智能时代的巨浪一跃成为了最大的硬件厂商赢家正是这一趋势的体现。本来，GPU（Graphics Processing Unit）是为了满足成千上万网游玩家而开发的一种专有芯片，它在矩阵乘积、三维图形渲染等功能的运算可以极大加速。没想到，机器学习中的神经网络恰恰也存在着大量的矩阵运算，这就使得GPU领域的霸主英伟达成就了伟大的事业。

无独有偶，最近的人机大战中，Google借机开始不遗余力地推广它新研发的TPU芯片。听说过CPU和GPU，这个TPU又是什么？这是Tensor Processing Unit的简称，其中Tensor是指张量，它是现在深度学习的基础数据结构。所以，Google的TPU本质上就是专为深度学习设计的人工神经网络芯片。随着深度学习技术的成熟，人们将会用神经芯片替代现有的芯片而装入成千上万的设备中。

据有关部门预测，到达2020年，接入互联网的设备将达到五百亿，是现在的3倍。如果每台设备都能接入TPU芯片，那么我们将会真正步入一个万物有灵的时代。

我们知道，深度神经网络本质上就是一种可以学习，能够不断适应外界的技术。所以，你的椅子将会适应你的习惯而自动地调节靠背的角度；你的眼镜将会自动将你感兴趣的画面拍摄成照片或视频存储下来；你可以直接用语言或者手势来操控空调；你家冰箱会自动识别、计算存储的食物，给你更好的膳食建议。甚至于每个小螺丝钉或者硬币都是有思想的（如果还有硬币的话），你可以在无聊的时候和它们聊聊天，询问一下今天的心情如何……

那么，深度学习需要耗费大量的GPU（或TPU）算力，小小硬件可以承载如此大规模的运算吗？实际上，在训练阶段，GPU的确会消耗掉大量的算力，但是装载到智能硬件中的神经网络大多都是训练好的，这种网络的运算需求没有那么强。况且，目前的人工智能界开发了一种Teacher－Student的训练方法，可以使得我们将一个大大的神经网络压缩到一个小小的芯片之中。

我们只需要让你通过大数据训练好的大网络作为老师，让你要安装在神经芯片中的小网络作为学生，然后让老师不断地吐出数据，来训练那个学生网络就可以得到一个既聪明又小巧得多的小型神经网络。

AI掌管世界

可以想到，一旦技术可以赋予万物智能，链接到互联网的设备将会呈现指数暴涨。接下来，就会出现一个非常严重的问题，就是究竟如何管理这些设备呢？

答案仍然是人工智能！即使我们人类可以无障碍地与这些智能设备进行自然交流，我们有限的认知资源仍然没办法管理爆炸式增长的设备，所以我们必须用人工智能来延伸我们的认知资源，去接管整个世界的运转。所以，AI掌管世界的局面将必然来到。

1、深度规划

AI怎么管理这个世界呢？它将主要依赖一种我称之为“深度规划”（Deep planning）的技术（请大家不要百度，这是我自己发明的一个词儿，真正的技术还没出来呢）。所谓的深度规划，就是指深度学习，特别是生成式模型深度学习与传统的规划技术相结合的混合物。

我们以智能家居的场景为例。

假如我劳累了一天拖动着疲惫的身躯回到了家里，然后我往沙发上一趟，就可以对着房间中的智能中心说“我累了，请想办法让我放松一下”。于是，智能中心接收到了指令以后，就会播放一段优美的音乐让我放松，背景调节成了暖暖的咖啡色，沙发靠垫也变成了按摩装置给我揉背。所有这一系列动作都需要人工智能帮我来做，而不需要我再分别针对音响系统、灯光系统、沙发靠垫一一发号施令。所以，要完成这一系列的动作，AI必须通过规划技术。进一步，如果第二天我同样回到家中，对智能中心喊：“我累了，请想办法让我放松一下”。于是，人工智能会给我提供完全不一样的方案，它很快将浴缸放满了水，并邀请我去泡个澡。

请注意，人工智能要做到这一点，不但要具备协调一系列智能设备的能力（就像现在大多数智能家居所能做到的），还需要提供多样性的解决方案。也就是说，机器知道“让我放松”这样一种状态，既可以用按摩、放音乐来完成，又可以用泡澡的方式来完成。

这就像是一个模式识别的反问题。在模式识别中，我们会对不同的图像归类为几种。尽管每次识别的时候，人脸图像会有少许的差异，但是深度学习网络仍然可以正确地识别。而现在的情形是，机器要根据一个指令“让我放松”，从而给出完全不一样的解决方案，并且每种方案都能让我识别成“放松”这样的状态——这就是深度规划。

深度学习模式识别是多对一的任务，而这种规划则是一对多的。深度规划更像现在的所谓生成式模型。例如，AI可以根据一句话从而生成一张图片，每次运行图片可能还会不一样，但是它们都具备类似的特征。如果我们将智能家居未来的状态理解为一张图片，那么深度规划神经网络就会根据我的指令输入生成未来的家居状态。

“深度规划”将会是AI接管世界最重要的技术之一。它的应用场景将不仅局限在智能家居和物联网。它更可以在社会生产中扮演重要的角色。你能想象2030年的淘宝将会是什么样子的？假如你要举办一个大型的生日Party，你可以直接对着淘宝的智能助理说，“我想要一个生日Party，充满创意，特别刺激的那种”。于是，淘宝智能助理会首先根据你这句话展开语义分析与理解，并开始利用深度规划技术来实现你这种所谓的“充满创意、特别刺激”，它会自动规划出，你需要购买什么什么服务，然后给出你相应的解决方案和花费让你确认。你的一个指令会激发淘宝智能助理一系列的动作，以满足你的需求，这就是深度规划。

2、AI自己玩的世界

“深度规划”技术还仅仅是把我们人类的注意力、认知资源进行了有限的延伸，但这显然不够。一旦智能硬件的增长速度达到了指数级，我们人类的认知延伸就触及不到了。于是，这个时候必然会出现一种局面，就是城市中出现了大面积的区域是人工智能自己玩的世界。

如上图所示，我们将人定为中心，则人的外围是我们的注意力经常打交道的世界。日后，这个区域将会被各种类似于亚马逊Echo的智能代理程序所包围，我们是透过这个界面与外界世界打交道的。紧接着，智能代理之外的一片区域将是智能代理控制，但是人类的认知资源很少触及的一片区域。这里将会是深度规划（Deep Planning）的主要负责区域，在这里，虽然我们的注意力已经很少触及，但是我们还是会偶尔对其进行观测和评价，从而监督智能代理。再往外就是我们人类认知资源基本上无法触及的区域了，而在这里将会形成一片人工智能自己玩的区域。

事实上，我们对这片领地也并不完全陌生，早在1969年就已经诞生了一个有史以来最大的“无人区”，这就是我们熟知的互联网。现在，没有人真正知晓整个互联网是如何运作的，我们已经完完全全将这片区域的主导权交给了算法。未来，这种趋势会愈演愈烈，无论是交通、社会，还是我们的经济系统，算法与人工智能会一点点地把它们蚕食掉，然而我们人类却对此不仅视而不见，反而乐此不疲。原因是，将管理交给人工智能将会是高效的！

在这一片AI自己的领地，一个比较有意思的问题就在于多个AI主体彼此之间的交互。集智俱乐部公众号曾经推送过一篇文章“经济推理与人工智能”，文章指出，主流经济学那些“陈旧、迂腐”的观点将会在这片无人区中复兴。

有关更多人工智能与AI之间的事儿，请看后续文章。

话题：