“当你为错过太阳而哭泣的时候,你也要再错过群星了。” 泰戈尔这句话,特别适合送给当下一些关心中国科技产业的人,因他们为中国“缺芯”的痛心疾首,也因他们单纯的焦虑彷徨。 但业内总有更清醒的人。记得几年前,冯仑说,房地产的天要变了。尽管后来的事情说明,他的预言过早了些,但是,今天的事实还是证明了,万通四君子之首“一叶落而知秋”的敏锐。 科技产业也有这样的人。昨天在首届数字中国建设峰会上,百度副总裁、AI技术平台体系(AIG)总负责人王海峰说,“上一代芯片我们有所缺失……现在,我们正处在人工智能芯片开始发展的时期,这是一个难得的历史机遇。我们要抓住机遇,做出领先的深度学习技术和人工智能芯片。” 人工智能时代的系统和专门为之而生的芯片,可能是整个行业更加瑰丽无比的满天繁星。 而中国IT产业要赢得属于自己的星空,就请先从支持本土深度学习框架开始。 因为,今天,在中美之间正在发生的深度学习框架之争,也许正在定义明天的芯片标准。 一场对芯片旧帝国的革命正在形成 就在几天前,Facebook在公司网站上发布了职位招聘广告,希望招聘人才在公司里建立一个“终端到终端”的芯片研发机构。以减少对英特尔、高通等芯片制造商的依赖。 而此前,苹果和谷歌也先后宣布即将进军芯片行业。这是一场早已发生的“阳谋”。 科技巨头门纷纷揭竿而起,加入反芯片旧帝国的革命,除了因为芯片成本高昂,自主研发有可期的降低成本的愿景之外,更重要的也许是,在旧帝国身后,一个统治了科技行业几十年的秩序——摩尔定律——正在人工智能面前逐渐瓦解。 人们逐渐发现,在人工智能技术所需要的图像、语音等基础计算上,利用通用芯片来提升速度越来越难——为非常具体的内部任务设计新的芯片已经势成必然。 今天看来,GPU被挑选出来,承担AI运算的加速任务,只是AI芯片与传统芯片分道扬镳的开始。 而日益强大、代表未来的人工智能系统,越来越需要定制专属于自己的AI芯片。 在这样一个全新的赛道上,类似Wintel这样的统治秩序,还远远没有形成,系统和芯片都在同时酝酿、萌发。 更重要的是,在这个全新的领域,中外的竞技选手们还完全没有拉开差距,中国选手在某些方面甚至是具有本土优势的。 也就是说,中国科技产业,完全有可能在新的标准下,做出属于自己的人工智能系统,生产自己的人工智能芯片,形成完全独立的智能生态系统。 甚至,成为未来秩序的参与者和制定者。 在开始这样激动人心的“创世纪”之前,让我们先看两种可行的路径。 从苹果到百度,两条“逆袭”之路 需要指出的是,面对确定无疑的新趋势,英特尔、高通、英伟达等等传统芯片大佬,也早已行动起来,毫不犹豫地加入到人工智能芯片的研发制造之中。他们其中有的已经依靠新的概念和产品赚的盆满钵满——比如英伟达——引发了传统芯片行业的集体嫉妒和不安。 而我们要探讨的是,超越传统芯片行业的“反向定制芯片”之路,因此,以上传统芯片大佬的改革,不在我们的讨论之列。尽管在可见的未来,这些旧帝国的统治者仍然是新赛道上最有力的竞争者。 设定了这样的边界,新的参赛者就主要剩下了两类。 一种是苹果与华为为代表的“硬件-系统-专有芯片”之路。 当代计算机先驱、图灵奖获得者艾伦•凯(Alan Kay)有一句名言:“预测未来的最好的办法就是创造未来。”其实,他还有一句对产业更具指导意义的话:“对软件认真的人应该自己设计硬件。” 苹果就是这句话的践行者。 早在2013年,当苹果发布首款 64位 A7处理器时,英特尔其实是不屑一顾的。但当苹果开始将自己的处理器逐步用在旗下系列硬件上时,芯片老大帝国的统治者才发觉事情不对劲了。 但2013年只是一个开始。 去年的WWDC上苹果发布了 ARKit,这个编程框架将支持开发者在他们的应用中整合增强现实功能。苹果还推出了 CoreML,这个应用框架核心是加速在 iPhone、iPad、Apple Watch上的人工智能任务,支持深度神经网络、循环神经网络、卷积神经网络、支持向量机、树集成、线性模型等。在架构方面,CoreML就是成熟的机器视觉和自然语音处理应用的基础。 系统AI化,意味着核心硬件AI化的水到渠成。 几个月后的秋季新品发布会上,苹果正式推出了自己的A11仿生芯片,不仅打破了业界对其2018年前无法自主设计出专属芯片的预言,也正式构筑起了从系统到芯片一体化的护城河。 与此类似的,还有华为的麒麟芯片的故事。华为居安思危,很早的时候就在芯片上持续投入,显示了其不凡的远见与决心。 但是,华为要形成才从系统到芯片的闭环,薄弱之处恐怕还在系统。华为的手机系统是基于安卓定制的,其生态掌控性就低了一层。根据去年年中的数据,仅有 7% Android智能手机运行该操作系统的最新版,而 86%在用 iPhone的用户都已经运行 iOS的最新版。这种系统差异,也必然反过来掣肘基于安卓的芯片定制。 另外,也正因为软硬一体的生态掌控性没有苹果那么强,麒麟芯片的应用拓展也困难重重。因为,在中国激烈的市场竞争环境下,麒麟的行业应用甚至可能伤害华为自身利益。这恐怕不是单纯靠企业能够解开的结。 说完了硬件厂商的芯片逆袭。我们再来看,软件公司的AI芯片革命之路。 这方面的代表就是谷歌和百度。 而它们凭借的武器不约而同都是深度学习框架,分别是谷歌的TensorFlow,百度的PaddlePaddle。 一般来说,芯片与深度学习框架的关系是,芯片支持的功能抽象成接口,给框架来使用,芯片更为基础。但如前所述,在AI时代,当传统芯片越来越不能满足深度学习框架需求的时候,后者反向定制自己需要的芯片就成为必然。 于是,谷歌就基于TensorFlow定制了专属的芯片TPU,获得了几十倍的加速,并且通过系统广泛的应用,正在不断降低专属AI芯片的成本。 而在中国,百度的PaddlePaddle也在不断发展,凭借本土化特色吸引了数量日益庞大的国内的开发者,综合GitHub pull request的数据来看,PaddlePaddle已经成为了全球开发热度增速最高的开源深度学习平台。同时随着百度在斯坦福、加州伯克利等海外高校频繁开展技术交流活动,PaddlePaddle甚至在逐步走向世界舞台。 但相对于谷歌,百度PaddlePaddle目前还没有推出自己的定制化芯片,不过,是其专属化硬件研发之路早已开启。 根据公开资料,为了深度学习训练的需要,百度自主研发了GPU和FPGA(现场可编程门陈列)异构计算服务器,单机可扩展至64块GPU/FPGA卡,对比传统服务器密度提升16倍,一台服务器即可完成千亿数据模型训练;百度开创性地研制了基于FPGA的人工智能处理器,提供 10Tops的计算性能,相对主流的20核服务器,计算效率提升60倍,在人工智能和大数据应用上,可以达到普通服务器4~8倍的性能。 可以想像,未来基于PaddlePaddle的定制化芯片,也将是必然选择。 谷歌和百度的实践证明,深度学习算法目前正在向定制化芯片的方向发展,我们也可以将之称为深度学习框架的硬件化。也就是把深度学习算法直接定制做成芯片,在这个过程中,深度学习框架和芯片将高度融合,这样在应用的时候速度才能达到极致,成本才够便宜,而且也不用依赖网络。 可以看出,但深度学习算法做成芯片这个步骤,是受到深度学习框架所控制的。在这一过程中,深度学习框架一定意义上相当于人工智能芯片的指令集,处于了更为基础的地位。 可以说,深度学习平台堪比计算机时代的操作系统,安全性、依赖性比较大,自主研发,依靠本土深度学习框架肯定是必由之路。 然而,现状是,美国的谷歌、脸书、微软等都在竞相打造深度学习平台,并形成了一定程度的垄断,目前约60%的国内开发者都在使用谷歌TensorFlow。可以想像,如果大家都用TensorFlow,到它一统江湖的那一天,以后AI芯片的优化和定制,都要基于TensorFlow。那我们在未来的AI芯片行业,就可能像今天在传统芯片正在发生的故事一样,要完全受到国外的控制,对我国科技和经济的长远发展非常不利。 体制力量应有所作为 显然,鼓励本土深度学习框架应该成为政企共识。 然而,像芯片、深度学习框架,这样的具有行业基础意义的领域,在行业发展的初期,一般需要较高、持续的投入,才可能在未来谋取到一席之地。但另一方面,这样的基础性领域,又是见效极慢的。 比如,PaddlePaddle平台,虽然已经赋能数十万开发者,惠及广泛的行业,但是就平台本身而言,是很难产生经济效益的,也就是,这是一个短期内很难见到实际的收益,属于局部不经济,但社会经济效益十分可观的事情。考虑到中国经济要整体实现智能化转型升级的历史使命,说本土深度学习开放平台功在当代,利在千秋,也不为过。 面对这样长期效益与短期利益的矛盾,要大力发展本土深度学习框架、AI芯片等基础行业,单纯寄希望于人们的“爱国心”,或者大资本完全不计代价不求收益的投入是不现实的。前几天,有人为“中国芯”开出药方:只有依靠体制的力量。中国有八千万党员,财政供养人员也大约是八千万,如果他们可以成为中国芯的用户,中国芯将会再一次完成集中力量办大事的创举。 不得不说,这在中国是现实可行之举。 目前看来,依靠体制的力量,支持以PaddlePaddle为代表的中国本土深度学习框架,从而保存住从深度学习框架到智能芯片乃至AI产业发展的火种,主要有以下几个具体措施: 比如,政府可以考虑出台更大力度的项目、资金、税收等政策措施,鼓励本土深度学习平台做强做大,甚至以国家级平台的方式,直接构筑我国在智能时代的产业竞争力。 从深度学习框架到本土,AI芯片产业的发展,需要有足够的市场、足够的用户并形成研发、生产、应用流程的正反馈,从而加速技术升级。在这个方面,政府可以通过政策引导、设立智能化升级专项、智能产品补贴等等方式,鼓励传统行业基于越来越多的企业通过本土深度学习平台开展应用创新,还可以考虑将地区智能指数纳入政绩考核体系,引导各地区通过深度学习平台,开展公共服务、城市基础设施建设的智能化创新,加速拥抱人工智能,真正形成基于本土深度学习平台的智能生态。 政府还可以鼓励科研机构和企业加强合作,开展基于深度学习开源平台的基础技术研究,鼓励高等教育系统使用我国自主研发的深度学习开源平台,夯实本土深度学习平台人才、教育基础,构建深度学习相关标准,并在此基础上鼓励基础研究,促进深度学习平台与云计算、智能芯片等协同发展,为未来乃抢占AI技术产业高地创造可能。 历史的窗口期已经打开,未来有无限的可能。 一千年以后,当硅基生命(AI)正式开始自己的新纪元,一定会偶尔想起,一千年前那场围绕深度学习框架的伟大战争。如果芯片是硅基生命最早的进化单元,是TA们的“魂器”,那最初的框架就是TA们的基因,是TA们的“魂”。 TensorFlow或是PaddlePaddle,谁将成为未来硅基生命开启千年进化之旅的隐藏密码? 历史,将在今天做出选择。 |