主页 > imtoken官网下载 > AI产业核心研究:芯片四大流派论剑,中国能否弯道超车?

AI产业核心研究:芯片四大流派论剑,中国能否弯道超车?

imtoken官网下载 2023-03-14 06:14:14

挖比特币用什么算法_详解比特币挖矿算法_比特币算法模拟C语言

随着AI行业的快速突破,AI领域各大公司的人才动向也备受关注。 你来来去去,你来我往,AI江湖掀起腥风血雨。 当然,AI领导者的变动会对具体的公司业务产生影响。 但从整个行业来看,人才的频繁流动,其实可能会促进行业的整体进程。

不信你查查历史。 AI功夫自1956年问世以来,经历了60年的风风雨雨,流派始终繁多,难学难练,无大成。

难学是因为需要掌握一种叫做“算法”的神奇技能; 它很难实践,因为它需要足够的计算能力来处理数据样本和训练机器。

几十年来,有算法却没有算力。 甚至有人认为人工智能是科幻小说,是小说家和人类开的玩笑。 没有人预料到进入 21 世纪后计算能力会爆发式增长。 它引发了整个人工智能行业划时代的变革。

其中,算法上升到sky-deep learning,分为DBN、CNN、BP、RBM等众多分支。其中,CNN(convolutional neural networks,简称卷积神经网络)应用广泛.

算力,脚踏实地——AI芯片。 各种芯片如雨后春笋般冒出来,用来训练机器,得心应手。

神殿也为 AI 的到来而激动。 世界各国都意识到了人工智能的重要性,都在纷纷吃着一桶桶牛奶迎接人工智能。

联合国在2016年发出通知,召集人类讨论制造和使用机器人如何推动人工智能的进步,以及可能出现的社会和伦理问题。

美国政府2016年连续颁发三枚金牌:《国家人工智能研发战略计划》、《为人工智能的未来做准备》、《人工智能、自动化与经济报告》,宣告加入人工智能的行列,并描述了此举所能带来的所有美好前景。

见状,英国政府立即照着药方发表了《机器人技术与人工智能》报告,详细阐述了英国机器人技术与人工智能的密切关系。

有算法有算力,天下就定了。 有政策有谋略,有细风细雨。 正是产业萌芽、草长莺飞、欣欣向荣的时刻。 人才流动是行业加速的信号。

这本书回到了原来的故事。 芯片定义了产业链和生态系统的基础计算架构。 正如CPU是IT产业的核心一样,芯片也是人工智能产业的核心。

据说世界上的AI芯片分为四大流派:

GPU目前如火如荼,就像东协一样,凭借并行计算已经形成了先发优势。

蛰伏在北方的FPGA,暗中纵横合作,大有统帅群雄之势,犹如乞丐帮。

南方割据的ASIC占据了很大的市场,参与的公司也很多。

比较“邪恶”的类脑芯片,打算直接复制大脑,也隐藏着夺取中原的野心。

根据网上公开发布的消息,今年以来,四大派派出了数十名高手参加华山论剑。 这些高手都是芯片设计时期的高手。

这些大师有什么特点? 谁能争得中原? 下面一一分析。

显卡派

市场上最著名的应该是GPU派了。 GPU,又称视觉处理器,是专门用于图像及相关处理的芯片。

挖比特币用什么算法_详解比特币挖矿算法_比特币算法模拟C语言

2012 年,多伦多大学博士生 Alex Krizhevsky 在 ImageNet 竞赛中获得 2012 年冠军。 Alex 想出了一个非常棒的模型,仅用两个 GPU 就可以在训练深度神经网络时取得优异的成绩。 一时间轰动江湖,引发了GPU训练神经网络的热潮。 要知道,在AI领域,过去一直使用CPU来处理数据,但是CPU的效率太低了。

当时,谷歌斥巨资采购了1.6万颗处理器,堆进了谷歌大脑,峰值功耗超过10万瓦,占地面积达数十平方米。 试问全世界,16000个处理器能玩多少人?

随着AlexNet划时代论文的出现,GPU在服务器端风靡全球。

可能有人会问,CPU和GPU都是处理器,两者有什么区别?

与CPU相比,GPU的出现要比CPU晚得多,但并行计算能力往往将CPU甩在后面。 并行计算是相对于串行计算而言的。 要知道自从计算机诞生以来,计算机编程几乎都是串行计算。 大多数程序只存在于一个进程或线程中,就像一个人只能先吃饭再聊天。

但是如果更多的人喜欢边吃边聊天呢? 遇到这样的问题,串行计算就傻眼了。 一次可以执行多条指令的并行计算算法,可以完美解决吃饭聊天的问题。 解决方案可分为时间平行和空间平行。 时间上的并行是指流水线技术,空间上的并行是指多处理器并发执行计算。

深度学习依赖于神经网络,通常网络越深,所需的训练时间越长。 对于一些网络结构,如果使用串行的X86处理器进行训练,可能需要几个月甚至几年的时间。 因此,必须采用并行甚至异构并行的方法来缩短训练时间。 可接受的。

在当前的人工智能芯片领域,GPU的应用领域不容小觑。 据Jon Peddie Research(JPR)市场研究公司统计,2008年至2015年期间,除2008年GPU市场规模略有下滑外,全球独立显卡的出货量和销售额均呈现明显上升趋势。 2012 年至 2015 年呈加速增长趋势。

GPU领域只有两家大公司。 一个是Nvidia,占据了大约70%的市场份额,另一个是AMD,占据了大约30%的市场份额。

比特币算法模拟C语言_详解比特币挖矿算法_挖比特币用什么算法

从GPU用户数量来看,根据Nvidia 2016年财报,相比2013年的100家和2014年的1549家,2015年有3409家机构或公司使用Nvidia的GPU产品从事人工智能研究。 这些企事业单位包括各高校的人工智能实验室、互联网企业、军工企业等。

AMD虽然落后于英伟达,但其市场份额在2016年呈现上升趋势,在发布代号为Vega的GPU芯片后,市场为之叫好,未来该趋势或将继续上升。

缺点是GPU耗电大(比如高端显卡经常用200W+),而且一旦开启,散热就成了一件麻烦事。

FPGA团伙

GPU的缺点就是太贵了,太贵了,还有副作用,散热是个大问题。 该怎么办?

Xilinx等公司对很多FPGA技术进行了改进,使其价格低廉、功耗低,实践起来更有趣。 因此,越来越多的人追随FPGA,形成了一个大流派。

FPGA从哪里来?

原来Xilinx早在1984年就发布了全球第一款FPGA,当时FPGA芯片体积大,但成本不低。 1992年后,由于FPGA采用了新的工艺节点,首次出现了FPGA上的卷积神经网络。 但直到2000年以后,FPGA丹法才与“伪装术”相结合,也就是说FPGA不仅仅是一个门阵列,更是一个集成了可编程逻辑的复杂功能集。 从2008年开始,FPGA不仅可以集成越来越多的系统模块和重要的控制功能,而且可以使用更高效的系统编程语言,如OpenCL和C语言,通过类软件的过程进行编程,降低了硬件编程的成本。 困难。 因此,从2011年开始,出现了大规模的基于FPGA的算法研究。

简单来说,FPGA的全称就是“Field Programmable Gate Array”。 其基本原理是在FPGA芯片中集成了大量数字电路的基本门电路和存储器,用户可以通过更新FPGA配置文件来定义这些。 门电路和存储器之间的连接。

挖比特币用什么算法_比特币算法模拟C语言_详解比特币挖矿算法

这里所说的“可编程”是完全“可变”的。 这意味着您今天可以将 FPGA 配置为微控制器 MCU,明天更新配置文件以将同一 FPGA 配置为音频编解码器。 有没有想过今天是老人明天是少女的孙悟空七十二变? 这是伪装的艺术。

与GPU的运算原理不同比特币算法模拟C语言,FPGA是直接由门电路运算,即编程中的语言在执行时会翻译成电路,优点是运算速度快。

FPGA在很多领域的表现都非常出色,以至于有人说未来FPGA可能会取代CPU和GPU成为机器人研发领域的主要芯片。 当然,这有点夸张。 目前FPGA大多作为CPU的协处理器出现。 对 GPU 的影响是显而易见的,但要取代 CPU,我们必须等待。

目前,国内已有多家初创公司自动加入FPGA阵营,提供基于FPGA的解决方案。 比如起源于清华大学的深鉴科技,专注于深度学习处理器和编译器技术。 深鉴科技研发了一种叫做“深度压缩”的技术,不仅可以将神经网络压缩几十倍而不影响Accuracy,还可以使用“片上存储”来存储深度学习算法模型,减少内存读取,大大降低功耗。

FPGA流派有两大两家小厂商,两家是Xilinx和Altera(Intel在2015年以167亿美元收购了Altera),两家是Lattice和Microsemi。

其中,Xilinx和Altera占据了近90%的市场份额,专利超过6000件。 剩下的 10% 的市场份额被拥有 3000 多项专利的美高森美和莱迪思瓜分。 由此可见,极高的技术门槛牢牢阻挡着其他想要进入FPGA市场的厂商。

FPGA 也有两个主要限制。

首先,FPGA 的峰值性能不如 GPU。 即使用高端服务器做FPGA编译,也需要几分钟,在移动端就更慢了。 但是,FPGA 的功耗低于 GPU。 如果FPGA的架构和配置合理,从能耗比来看,是可以超过GPU的。

其次,FPGA编程难度较大。 程序员需要精通软件和硬件编程语言,更适合高水平的资深技术玩家。 FPGA芯片主要面向企业客户,如百度、微软、IBM等公司都有专门的FPGA团队来加速服务器。

从未来的发展来看,FPGA的崛起指日可待。 原因有以下三个:

首先,在人工智能的初级阶段,算法大约每三个月迭代一次。 仅以此为基础,FPGA可以灵活调整电路配置以适应新的算法,具有一定的优势;

其次,相对于GPU,FPGA更适合深度学习的应用阶段;

最后,为了降低FPGA编程的难度,FPGA厂商Xilinx专门开发了可重构加速栈,提供基于FPGA的硬件加速解决方案,类似于App Store。 Xilinx 是一个平台,用户可以直接从商店中挑选解决方案,不再需要自己设计布局和布线。

ASIC:引星大法的突破

GPU虽然在并行计算方面有很多优势,但毕竟不是专门为机器学习设计的。 FPGA需要用户自主编程,主要面向专业领域的企业用户,门槛太高。

大众消费呢? 如果应用于无人驾驶汽车或智能家居终端,这款芯片必须同时满足高性能和低功耗的要求。 它甚至不需要将数据发送回服务器,也不需要连接到 Internet。 本地实时计算就够了。 .

详解比特币挖矿算法_挖比特币用什么算法_比特币算法模拟C语言

ASIC 挺身而出。

ASIC的全称是Application-Specific Integrated Circuit(专用集成电路)。

玩过比特币的都知道著名的挖矿大战。 ASIC在比特币挖矿领域展现了其独特的优势。 2013年1月,Avalon项目组交付全球首台商用比特币ASIC矿机,轰动矿界。 CPU和GPU矿机几乎一夜之间消失,引发了比特币矿业的第二次大升级。 比特币网络的核心开发者 Jeff Garzik 有幸成为第一台商用 ASIC 矿机的拥有者 或者,据说当时收到 Avalon 矿机的用户在一两天内就把钱还了. 据说,隐藏在农村的土豪有上千台ASIC矿机可以使用。

人工智能深度学习和比特币挖矿的相似之处在于,它们都依赖底层芯片进行大规模并行计算。

ASIC分为全定制和半定制。 全定制设计需要设计人员完成所有电路的设计,因此需要大量的人力物力,灵活性好,但开发周期长,上市时间慢。 专为机器学习设计的ASIC芯片,从设计到制造都需要更高的资金和技术。 一般来说,基于FPGA的开发周期在六个月左右,而同规格的ASIC需要一年左右,需要经过多步验证。 可以想象,在如此精细的打磨下,其性能自然会更加出色。 杰出的。

ASIC研发时间过长,意味着ASIC芯片很可能跟不上市场变化的速度,导致厂商陷入竹篮打水的尴尬境地。

有什么办法可以改善吗?

有。

既然一个公司设计一个ASIC需要太多时间,为什么不用别人现成的模块呢?

于是SoC+IP的模式开始流行起来。 这种模式有点像招星的方法。

SoC的全称是“片上系统(System-on-chip)”,即集成了很多不同模块的芯片。 SoC上的每个模块都可以称为IP,可以自己设计,也可以从其他公司购买,集成到自己的芯片中。

与ASIC相比,SoC+IP模式的上市时间更短,成本更低,IP更能灵活满足用户需求。 IP公司专注于IP模块的设计,而SoC公司则专注于芯片集成,分工合作提高效率。

事实上,高通已经在开发可以在本地进行深度学习的移动设备芯片,CEVA、Kneron等IP设计公司也在开发与人工智能相关的IP核。 这种模式也将是未来人工智能芯片的发展方向之一。

ASIC 易学难实践。 如果你想获得巨大的成功,你会花费很多钱。 所以,玩ASIC的富豪大有人在。 例如,谷歌在2016年推出了可编程AI加速器TPU,英特尔也将在2017年推出专为深度学习设计的芯片Knights Mill。微软构建了Project Catapult来支持微软Bing。

从创业公司的角度来看,美国Wave Computing主打深度学习芯片架构,推出DPU(Dataflow Processing Unit); 英国Graphcore将推出开源软件框架Poplar和智能处理单元IPU。

与科技巨头相比,初创企业更倾向于结合具体的应用场景来设计芯片,比如地平线设计的第一代BPU(大脑处理单元),用于开发ADAS系统。

中科院计算所于2008年开始研究,项目名称为寒武纪。 主要资金来源为中科院先导项目和国家自然科学基金。 责任人为陈氏兄弟、陈云济、陈天石。 目前,寒武纪系列已经包括三款原型处理器结构:寒武纪一号(英文名DianNao,protocol processor structure for neural networks); 寒武纪2号(英文名DaDianNao,面向大规模神经网络); 寒武纪第3号(英文名PuDianNao,针对各种机器学习算法)。

类脑芯片:复制另一个人脑

类脑芯片不得不提IBM。 每次行业发生变化,IBN总会给大家带来一些新的名词。 比如电子商务、智慧地球、认知计算,还有现在号称可以复制人脑的类脑芯片。 技术真的太黑了。

IBM类脑芯片的后台支持者是美国国防高级研究计划局(DARPA)。 DARPA是科技界的泰山北斗。 广为人知的互联网前身阿帕网就起源于这个机构。

DARPA 与 IBM 合作建立了一个名为神经形态自适应可扩展塑料电子系统计划 (SyNAPSE) 的计划。 该计划旨在恢复大脑的计算功能,从而创建一个能够模拟人类感觉、理解、行动和交流能力的系统。 使用人类武器进行自动战斗。

这个项目中最引人注目的是类脑芯片TrueNorth。 2011年,IBM发布了第一代TrueNorth芯片,可以像大脑一样学习和处理信息,具有海量并行计算能力。 2014年,IBM发布了第二代TrueNorth芯片。 性能大幅提升,但功耗仅为70毫瓦。 神经元数量从 256 个增加到 100 万个,可编程突触的数量从 262,144 个增加到 2.56 亿个。 高通还发布了Zeroth认知计算平台,可以集成到高通骁龙处理器芯片中,通过协同处理提升系统的认知计算性能,并实际应用于终端设备。

比特币算法模拟C语言_详解比特币挖矿算法_挖比特币用什么算法

“真北”的问世,激起了国内研究机构对人工智能的热情。

上海西景科技去年发布了全球首款拥有 5000 万个神经元的类脑芯片。 该公司称,这是目前全球神经元数量最多的类脑芯片,也是第一款商用的类脑芯片。

去年6月,中星微宣布中国首款嵌入式神经网络处理器(NPU)芯片诞生,该芯片已量产,主要应用于嵌入式视频监控领域。

据说北大正在研究另一条路线——忆阻器。 据媒体报道,北京大学在视听感知和图像视频编码方面的研究处于国际领先水平。 在使用神经形态芯片构建大规模神经网络中,围绕视觉皮层模拟展开了研究。

中科院陈云骥认为,总体而言,我国与以IBM的TrueNorth芯片为代表的国际先进水平还有一定差距。 这个差距不是体现在单芯片的绝对运算速度上(实际上国产类脑芯片每秒能进行的神经元运算和突触运算数量是TBM的TrueNorth的十倍),而是从单芯片的计算速度上看的功耗。 TrueNorth芯片功耗仅为65毫瓦,比国产芯片低250倍(约15瓦)。

从芯片性能来看,类脑芯片的计算能力和精度无法超过GPU和FPGA的最佳水平。 因此,类脑芯片在人工智能芯片的主要方向中是最不受欢迎的。

未来类脑芯片能否超越其他流派? 这取决于人类能否全面了解人脑的结构,是否有更多的理论和实验支持类脑芯片技术的突破。 目前,类脑芯片在商业化的道路上还需要探索一段时间。

华山论剑,中国能否弯道超车?

AI芯片是人工智能产业的舞台。

产业刚刚萌芽,东邪西毒,南帝北丐,都在奔赴华山的路上。 似乎每个人都有机会成为英雄。 但是,如果站在国家的角度来看,就会发现一个残酷的现象。 之所以残酷,是因为中美之间存在相当大的差距。 比赛一开始,美国就赢了。

在一些知名的芯片厂商中,美国就有13家。 领头羊既有谷歌、英特尔、IBM等科技巨头,也有高通、英伟达、AMD、赛灵思等在各自领域具有绝对优势的大公司。 ,以及一些发展良好的中型公司和活跃的初创企业。

但中国主要是创业公司为主,没有巨头。 7家公司中有6家是初创公司,都是在过去三年内成立的,只有一家中型公司——中星微电子。

从芯片品类来看,美国厂商遍布人工智能芯片四大流派。 IC设计的产业结构非常均衡。 在GPU领域,美国企业完全垄断,中国为零; 灵丝作解; 在ASIC领域,大约有4家初创公司; 还有2个类脑芯片。

芯片是数字经济产业的核心,向来易守难攻。 先发优势一旦形成,后来者就难以超越。 AI芯片也不例外。 过去十年间,包括英特尔、IBM、摩托罗拉、飞利浦、东芝、三星在内的60多家公司都试图进入AI芯片领域,但都遭遇了惨重的失败。

究其原因在于准入门槛高,主要有以下几点:

首先是专利的技术壁垒。 这四家FPGA公司利用近9000项专利,构筑起长长的知识产权壁垒,将攻击者拒之门外。 即便是强如英特尔,也忍不住以167亿美元的成本收购了Altera,拿到了FPGA领域的入场券。 更不用说动手使用 GPU 了。

二是市场相对较小。 2016年全球FPGA市场总额仅为50亿美元,其中90%落入Xilinx和Altera。 如此小的市场规模难以支撑起过多的大公司,必然导致竞争异常激烈。

最后,投资周期长。 专利壁垒可能会被克服,市场可能会很小并且可以容忍。 然而比特币算法模拟C语言,FPGA产品从投入研发到真正量产,用了将近七年的时间。 在此期间几乎没有任何商业回报。 正常的风险投资等不了这么久。

AI时代,芯片是核心。

AI芯片作为产业的上游,也是技术要求和附加值最高的环节。 产业价值和战略地位远大于应用层创新,需要高度重视。

纵观时代变迁,CPU领域WINTEL联盟一统江山,突破难度极大,而AI芯片方兴未艾,机会逐渐显现,AI领域必然产生未来像英特尔和AMD这样的世界级公司。

美国以绝对实力处于领先地位,但中国一批初创企业也蓄势待发。

不过,AI芯片领域的创新绝非一蹴而就。 它涉及人工智能算法、编程语言、计算机体系结构、集成电路技术、半导体技术等方方面面。 在巨大的国际竞争压力下,仅靠单一企业的研发投入是远远不够的; 也不能仅仅依靠有限的风险投资。 光靠科技补贴是解不了渴的。

我们如何相信中国企业有机会成为人工智能时代的潮流引领者,在AI芯片华山论战中占据一席之地? 群体创新或许是未来突破的方向。 AI领域创业空间巨大,所需资金规模庞大,所需资源庞大。 单靠个人创业者和团队的能力打天下已经不现实了。 人工智能创业者需要与产业加速器、产业资本紧密结合,共同创新。 有更广阔的发展空间。

笔者通过对腾讯众创的调研了解到,国内很多初创企业都学会了群体创新。 以长青腾创业营为例,经过100多天的运营,40家创业公司的总估值翻了一番,达到600亿以上,58%的学员成功进入下一轮融资,总金额100天融资额超60亿。 目前,长青正在筹划一个人工智能创业营。

这对中国的AI芯片创业有什么启示吗?

挖比特币用什么算法_详解比特币挖矿算法_比特币算法模拟C语言