主页 > imtoken官网下载 > AI产业核心研究：芯片四大流派论剑，中国能否弯道超车？

AI产业核心研究：芯片四大流派论剑，中国能否弯道超车？

imtoken官网下载 2023-03-14 06:14:14

挖比特币用什么算法_详解比特币挖矿算法_比特币算法模拟C语言

随着AI行业的快速突破，AI领域各大公司的人才动向也备受关注。你来来去去，你来我往，AI江湖掀起腥风血雨。当然，AI领导者的变动会对具体的公司业务产生影响。但从整个行业来看，人才的频繁流动，其实可能会促进行业的整体进程。

不信你查查历史。 AI功夫自1956年问世以来，经历了60年的风风雨雨，流派始终繁多，难学难练，无大成。

难学是因为需要掌握一种叫做“算法”的神奇技能；它很难实践，因为它需要足够的计算能力来处理数据样本和训练机器。

几十年来，有算法却没有算力。甚至有人认为人工智能是科幻小说，是小说家和人类开的玩笑。没有人预料到进入 21 世纪后计算能力会爆发式增长。它引发了整个人工智能行业划时代的变革。

其中，算法上升到sky-deep learning，分为DBN、CNN、BP、RBM等众多分支。其中，CNN（convolutional neural networks，简称卷积神经网络）应用广泛.

算力，脚踏实地——AI芯片。各种芯片如雨后春笋般冒出来，用来训练机器，得心应手。

神殿也为 AI 的到来而激动。世界各国都意识到了人工智能的重要性，都在纷纷吃着一桶桶牛奶迎接人工智能。

联合国在2016年发出通知，召集人类讨论制造和使用机器人如何推动人工智能的进步，以及可能出现的社会和伦理问题。

美国政府2016年连续颁发三枚金牌：《国家人工智能研发战略计划》、《为人工智能的未来做准备》、《人工智能、自动化与经济报告》，宣告加入人工智能的行列，并描述了此举所能带来的所有美好前景。

见状，英国政府立即照着药方发表了《机器人技术与人工智能》报告，详细阐述了英国机器人技术与人工智能的密切关系。

有算法有算力，天下就定了。有政策有谋略，有细风细雨。正是产业萌芽、草长莺飞、欣欣向荣的时刻。人才流动是行业加速的信号。

这本书回到了原来的故事。芯片定义了产业链和生态系统的基础计算架构。正如CPU是IT产业的核心一样，芯片也是人工智能产业的核心。

据说世界上的AI芯片分为四大流派：

GPU目前如火如荼，就像东协一样，凭借并行计算已经形成了先发优势。

蛰伏在北方的FPGA，暗中纵横合作，大有统帅群雄之势，犹如乞丐帮。

南方割据的ASIC占据了很大的市场，参与的公司也很多。

比较“邪恶”的类脑芯片，打算直接复制大脑，也隐藏着夺取中原的野心。

根据网上公开发布的消息，今年以来，四大派派出了数十名高手参加华山论剑。这些高手都是芯片设计时期的高手。

这些大师有什么特点？谁能争得中原？下面一一分析。

显卡派

市场上最著名的应该是GPU派了。 GPU，又称视觉处理器，是专门用于图像及相关处理的芯片。

挖比特币用什么算法_详解比特币挖矿算法_比特币算法模拟C语言

2012 年，多伦多大学博士生 Alex Krizhevsky 在 ImageNet 竞赛中获得 2012 年冠军。 Alex 想出了一个非常棒的模型，仅用两个 GPU 就可以在训练深度神经网络时取得优异的成绩。一时间轰动江湖，引发了GPU训练神经网络的热潮。要知道，在AI领域，过去一直使用CPU来处理数据，但是CPU的效率太低了。

当时，谷歌斥巨资采购了1.6万颗处理器，堆进了谷歌大脑，峰值功耗超过10万瓦，占地面积达数十平方米。试问全世界，16000个处理器能玩多少人？

随着AlexNet划时代论文的出现，GPU在服务器端风靡全球。

可能有人会问，CPU和GPU都是处理器，两者有什么区别？

与CPU相比，GPU的出现要比CPU晚得多，但并行计算能力往往将CPU甩在后面。并行计算是相对于串行计算而言的。要知道自从计算机诞生以来，计算机编程几乎都是串行计算。大多数程序只存在于一个进程或线程中，就像一个人只能先吃饭再聊天。

但是如果更多的人喜欢边吃边聊天呢？遇到这样的问题，串行计算就傻眼了。一次可以执行多条指令的并行计算算法，可以完美解决吃饭聊天的问题。解决方案可分为时间平行和空间平行。时间上的并行是指流水线技术，空间上的并行是指多处理器并发执行计算。

深度学习依赖于神经网络，通常网络越深，所需的训练时间越长。对于一些网络结构，如果使用串行的X86处理器进行训练，可能需要几个月甚至几年的时间。因此，必须采用并行甚至异构并行的方法来缩短训练时间。可接受的。

在当前的人工智能芯片领域，GPU的应用领域不容小觑。据Jon Peddie Research（JPR）市场研究公司统计，2008年至2015年期间，除2008年GPU市场规模略有下滑外，全球独立显卡的出货量和销售额均呈现明显上升趋势。 2012 年至 2015 年呈加速增长趋势。

GPU领域只有两家大公司。一个是Nvidia，占据了大约70%的市场份额，另一个是AMD，占据了大约30%的市场份额。

比特币算法模拟C语言_详解比特币挖矿算法_挖比特币用什么算法

从GPU用户数量来看，根据Nvidia 2016年财报，相比2013年的100家和2014年的1549家，2015年有3409家机构或公司使用Nvidia的GPU产品从事人工智能研究。这些企事业单位包括各高校的人工智能实验室、互联网企业、军工企业等。

AMD虽然落后于英伟达，但其市场份额在2016年呈现上升趋势，在发布代号为Vega的GPU芯片后，市场为之叫好，未来该趋势或将继续上升。

缺点是GPU耗电大（比如高端显卡经常用200W+），而且一旦开启，散热就成了一件麻烦事。

FPGA团伙

GPU的缺点就是太贵了，太贵了，还有副作用，散热是个大问题。该怎么办？

Xilinx等公司对很多FPGA技术进行了改进，使其价格低廉、功耗低，实践起来更有趣。因此，越来越多的人追随FPGA，形成了一个大流派。

FPGA从哪里来？

原来Xilinx早在1984年就发布了全球第一款FPGA，当时FPGA芯片体积大，但成本不低。 1992年后，由于FPGA采用了新的工艺节点，首次出现了FPGA上的卷积神经网络。但直到2000年以后，FPGA丹法才与“伪装术”相结合，也就是说FPGA不仅仅是一个门阵列，更是一个集成了可编程逻辑的复杂功能集。从2008年开始，FPGA不仅可以集成越来越多的系统模块和重要的控制功能，而且可以使用更高效的系统编程语言，如OpenCL和C语言，通过类软件的过程进行编程，降低了硬件编程的成本。困难。因此，从2011年开始，出现了大规模的基于FPGA的算法研究。

简单来说，FPGA的全称就是“Field Programmable Gate Array”。其基本原理是在FPGA芯片中集成了大量数字电路的基本门电路和存储器，用户可以通过更新FPGA配置文件来定义这些。门电路和存储器之间的连接。

挖比特币用什么算法_比特币算法模拟C语言_详解比特币挖矿算法

这里所说的“可编程”是完全“可变”的。这意味着您今天可以将 FPGA 配置为微控制器 MCU，明天更新配置文件以将同一 FPGA 配置为音频编解码器。有没有想过今天是老人明天是少女的孙悟空七十二变？这是伪装的艺术。

与GPU的运算原理不同比特币算法模拟C语言，FPGA是直接由门电路运算，即编程中的语言在执行时会翻译成电路，优点是运算速度快。

FPGA在很多领域的表现都非常出色，以至于有人说未来FPGA可能会取代CPU和GPU成为机器人研发领域的主要芯片。当然，这有点夸张。目前FPGA大多作为CPU的协处理器出现。对 GPU 的影响是显而易见的，但要取代 CPU，我们必须等待。

目前，国内已有多家初创公司自动加入FPGA阵营，提供基于FPGA的解决方案。比如起源于清华大学的深鉴科技，专注于深度学习处理器和编译器技术。深鉴科技研发了一种叫做“深度压缩”的技术，不仅可以将神经网络压缩几十倍而不影响Accuracy，还可以使用“片上存储”来存储深度学习算法模型，减少内存读取，大大降低功耗。

FPGA流派有两大两家小厂商，两家是Xilinx和Altera（Intel在2015年以167亿美元收购了Altera），两家是Lattice和Microsemi。

其中，Xilinx和Altera占据了近90%的市场份额，专利超过6000件。剩下的 10% 的市场份额被拥有 3000 多项专利的美高森美和莱迪思瓜分。由此可见，极高的技术门槛牢牢阻挡着其他想要进入FPGA市场的厂商。

FPGA 也有两个主要限制。

首先，FPGA 的峰值性能不如 GPU。即使用高端服务器做FPGA编译，也需要几分钟，在移动端就更慢了。但是，FPGA 的功耗低于 GPU。如果FPGA的架构和配置合理，从能耗比来看，是可以超过GPU的。

其次，FPGA编程难度较大。程序员需要精通软件和硬件编程语言，更适合高水平的资深技术玩家。 FPGA芯片主要面向企业客户，如百度、微软、IBM等公司都有专门的FPGA团队来加速服务器。

从未来的发展来看，FPGA的崛起指日可待。原因有以下三个：

首先，在人工智能的初级阶段，算法大约每三个月迭代一次。仅以此为基础，FPGA可以灵活调整电路配置以适应新的算法，具有一定的优势；

其次，相对于GPU，FPGA更适合深度学习的应用阶段；

最后，为了降低FPGA编程的难度，FPGA厂商Xilinx专门开发了可重构加速栈，提供基于FPGA的硬件加速解决方案，类似于App Store。 Xilinx 是一个平台，用户可以直接从商店中挑选解决方案，不再需要自己设计布局和布线。

ASIC：引星大法的突破

GPU虽然在并行计算方面有很多优势，但毕竟不是专门为机器学习设计的。 FPGA需要用户自主编程，主要面向专业领域的企业用户，门槛太高。

大众消费呢？如果应用于无人驾驶汽车或智能家居终端，这款芯片必须同时满足高性能和低功耗的要求。它甚至不需要将数据发送回服务器，也不需要连接到 Internet。本地实时计算就够了。 .

详解比特币挖矿算法_挖比特币用什么算法_比特币算法模拟C语言

ASIC 挺身而出。

ASIC的全称是Application-Specific Integrated Circuit（专用集成电路）。

玩过比特币的都知道著名的挖矿大战。 ASIC在比特币挖矿领域展现了其独特的优势。 2013年1月，Avalon项目组交付全球首台商用比特币ASIC矿机，轰动矿界。 CPU和GPU矿机几乎一夜之间消失，引发了比特币矿业的第二次大升级。比特币网络的核心开发者 Jeff Garzik 有幸成为第一台商用 ASIC 矿机的拥有者或者，据说当时收到 Avalon 矿机的用户在一两天内就把钱还了. 据说，隐藏在农村的土豪有上千台ASIC矿机可以使用。

人工智能深度学习和比特币挖矿的相似之处在于，它们都依赖底层芯片进行大规模并行计算。

ASIC分为全定制和半定制。全定制设计需要设计人员完成所有电路的设计，因此需要大量的人力物力，灵活性好，但开发周期长，上市时间慢。专为机器学习设计的ASIC芯片，从设计到制造都需要更高的资金和技术。一般来说，基于FPGA的开发周期在六个月左右，而同规格的ASIC需要一年左右，需要经过多步验证。可以想象，在如此精细的打磨下，其性能自然会更加出色。杰出的。

ASIC研发时间过长，意味着ASIC芯片很可能跟不上市场变化的速度，导致厂商陷入竹篮打水的尴尬境地。

有什么办法可以改善吗？

有。

既然一个公司设计一个ASIC需要太多时间，为什么不用别人现成的模块呢？

于是SoC+IP的模式开始流行起来。这种模式有点像招星的方法。

SoC的全称是“片上系统（System-on-chip）”，即集成了很多不同模块的芯片。 SoC上的每个模块都可以称为IP，可以自己设计，也可以从其他公司购买，集成到自己的芯片中。

与ASIC相比，SoC+IP模式的上市时间更短，成本更低，IP更能灵活满足用户需求。 IP公司专注于IP模块的设计，而SoC公司则专注于芯片集成，分工合作提高效率。

事实上，高通已经在开发可以在本地进行深度学习的移动设备芯片，CEVA、Kneron等IP设计公司也在开发与人工智能相关的IP核。这种模式也将是未来人工智能芯片的发展方向之一。

ASIC 易学难实践。如果你想获得巨大的成功，你会花费很多钱。所以，玩ASIC的富豪大有人在。例如，谷歌在2016年推出了可编程AI加速器TPU，英特尔也将在2017年推出专为深度学习设计的芯片Knights Mill。微软构建了Project Catapult来支持微软Bing。

从创业公司的角度来看，美国Wave Computing主打深度学习芯片架构，推出DPU（Dataflow Processing Unit）；英国Graphcore将推出开源软件框架Poplar和智能处理单元IPU。

与科技巨头相比，初创企业更倾向于结合具体的应用场景来设计芯片，比如地平线设计的第一代BPU（大脑处理单元），用于开发ADAS系统。

中科院计算所于2008年开始研究，项目名称为寒武纪。主要资金来源为中科院先导项目和国家自然科学基金。责任人为陈氏兄弟、陈云济、陈天石。目前，寒武纪系列已经包括三款原型处理器结构：寒武纪一号（英文名DianNao，protocol processor structure for neural networks）；寒武纪2号（英文名DaDianNao，面向大规模神经网络）；寒武纪第3号（英文名PuDianNao，针对各种机器学习算法）。

类脑芯片：复制另一个人脑

类脑芯片不得不提IBM。每次行业发生变化，IBN总会给大家带来一些新的名词。比如电子商务、智慧地球、认知计算，还有现在号称可以复制人脑的类脑芯片。技术真的太黑了。

IBM类脑芯片的后台支持者是美国国防高级研究计划局（DARPA）。 DARPA是科技界的泰山北斗。广为人知的互联网前身阿帕网就起源于这个机构。

DARPA 与 IBM 合作建立了一个名为神经形态自适应可扩展塑料电子系统计划 (SyNAPSE) 的计划。该计划旨在恢复大脑的计算功能，从而创建一个能够模拟人类感觉、理解、行动和交流能力的系统。使用人类武器进行自动战斗。

这个项目中最引人注目的是类脑芯片TrueNorth。 2011年，IBM发布了第一代TrueNorth芯片，可以像大脑一样学习和处理信息，具有海量并行计算能力。 2014年，IBM发布了第二代TrueNorth芯片。性能大幅提升，但功耗仅为70毫瓦。神经元数量从 256 个增加到 100 万个，可编程突触的数量从 262,144 个增加到 2.56 亿个。高通还发布了Zeroth认知计算平台，可以集成到高通骁龙处理器芯片中，通过协同处理提升系统的认知计算性能，并实际应用于终端设备。

比特币算法模拟C语言_详解比特币挖矿算法_挖比特币用什么算法

“真北”的问世，激起了国内研究机构对人工智能的热情。

上海西景科技去年发布了全球首款拥有 5000 万个神经元的类脑芯片。该公司称，这是目前全球神经元数量最多的类脑芯片，也是第一款商用的类脑芯片。

去年6月，中星微宣布中国首款嵌入式神经网络处理器（NPU）芯片诞生，该芯片已量产，主要应用于嵌入式视频监控领域。

据说北大正在研究另一条路线——忆阻器。据媒体报道，北京大学在视听感知和图像视频编码方面的研究处于国际领先水平。在使用神经形态芯片构建大规模神经网络中，围绕视觉皮层模拟展开了研究。

中科院陈云骥认为，总体而言，我国与以IBM的TrueNorth芯片为代表的国际先进水平还有一定差距。这个差距不是体现在单芯片的绝对运算速度上（实际上国产类脑芯片每秒能进行的神经元运算和突触运算数量是TBM的TrueNorth的十倍），而是从单芯片的计算速度上看的功耗。 TrueNorth芯片功耗仅为65毫瓦，比国产芯片低250倍（约15瓦）。

从芯片性能来看，类脑芯片的计算能力和精度无法超过GPU和FPGA的最佳水平。因此，类脑芯片在人工智能芯片的主要方向中是最不受欢迎的。

未来类脑芯片能否超越其他流派？这取决于人类能否全面了解人脑的结构，是否有更多的理论和实验支持类脑芯片技术的突破。目前，类脑芯片在商业化的道路上还需要探索一段时间。

华山论剑，中国能否弯道超车？

AI芯片是人工智能产业的舞台。

产业刚刚萌芽，东邪西毒，南帝北丐，都在奔赴华山的路上。似乎每个人都有机会成为英雄。但是，如果站在国家的角度来看，就会发现一个残酷的现象。之所以残酷，是因为中美之间存在相当大的差距。比赛一开始，美国就赢了。

在一些知名的芯片厂商中，美国就有13家。领头羊既有谷歌、英特尔、IBM等科技巨头，也有高通、英伟达、AMD、赛灵思等在各自领域具有绝对优势的大公司。，以及一些发展良好的中型公司和活跃的初创企业。

但中国主要是创业公司为主，没有巨头。 7家公司中有6家是初创公司，都是在过去三年内成立的，只有一家中型公司——中星微电子。

从芯片品类来看，美国厂商遍布人工智能芯片四大流派。 IC设计的产业结构非常均衡。在GPU领域，美国企业完全垄断，中国为零；灵丝作解；在ASIC领域，大约有4家初创公司；还有2个类脑芯片。

芯片是数字经济产业的核心，向来易守难攻。先发优势一旦形成，后来者就难以超越。 AI芯片也不例外。过去十年间，包括英特尔、IBM、摩托罗拉、飞利浦、东芝、三星在内的60多家公司都试图进入AI芯片领域，但都遭遇了惨重的失败。

究其原因在于准入门槛高，主要有以下几点：

首先是专利的技术壁垒。这四家FPGA公司利用近9000项专利，构筑起长长的知识产权壁垒，将攻击者拒之门外。即便是强如英特尔，也忍不住以167亿美元的成本收购了Altera，拿到了FPGA领域的入场券。更不用说动手使用 GPU 了。

二是市场相对较小。 2016年全球FPGA市场总额仅为50亿美元，其中90%落入Xilinx和Altera。如此小的市场规模难以支撑起过多的大公司，必然导致竞争异常激烈。

最后，投资周期长。专利壁垒可能会被克服，市场可能会很小并且可以容忍。然而比特币算法模拟C语言，FPGA产品从投入研发到真正量产，用了将近七年的时间。在此期间几乎没有任何商业回报。正常的风险投资等不了这么久。

AI时代，芯片是核心。

AI芯片作为产业的上游，也是技术要求和附加值最高的环节。产业价值和战略地位远大于应用层创新，需要高度重视。

纵观时代变迁，CPU领域WINTEL联盟一统江山，突破难度极大，而AI芯片方兴未艾，机会逐渐显现，AI领域必然产生未来像英特尔和AMD这样的世界级公司。

美国以绝对实力处于领先地位，但中国一批初创企业也蓄势待发。

不过，AI芯片领域的创新绝非一蹴而就。它涉及人工智能算法、编程语言、计算机体系结构、集成电路技术、半导体技术等方方面面。在巨大的国际竞争压力下，仅靠单一企业的研发投入是远远不够的；也不能仅仅依靠有限的风险投资。光靠科技补贴是解不了渴的。

我们如何相信中国企业有机会成为人工智能时代的潮流引领者，在AI芯片华山论战中占据一席之地？群体创新或许是未来突破的方向。 AI领域创业空间巨大，所需资金规模庞大，所需资源庞大。单靠个人创业者和团队的能力打天下已经不现实了。人工智能创业者需要与产业加速器、产业资本紧密结合，共同创新。有更广阔的发展空间。

笔者通过对腾讯众创的调研了解到，国内很多初创企业都学会了群体创新。以长青腾创业营为例，经过100多天的运营，40家创业公司的总估值翻了一番，达到600亿以上，58%的学员成功进入下一轮融资，总金额100天融资额超60亿。目前，长青正在筹划一个人工智能创业营。

这对中国的AI芯片创业有什么启示吗？

挖比特币用什么算法_详解比特币挖矿算法_比特币算法模拟C语言

上一篇：以太坊有多少钱？

下一篇：移动支付和第三方支付其实就是电子货币的流通

主页 > imtoken官网下载 > AI产业核心研究：芯片四大流派论剑，中国能否弯道超车？

AI产业核心研究：芯片四大流派论剑，中国能否弯道超车？

相关文章