欢迎来到 1316岁macbookpro-知乎精选
全国咨询热线:0781-986543
新闻中心
世界上最快的AI芯片,是何方神圣?
  来源:1316岁macbookpro-知乎精选  更新时间:2023-11-29 03:03:16


本文来自微信大众号:电子工程国际(ID:EEworldbbs) ,作者:付斌 ,芯片题图来自 :视觉我国 。何方

这两天,世界上最神圣IBM低沉地发了一个新闻 ,芯片推出了一款类脑芯片“北极”(NorthPole),何方比照4nm节点完成的世界上最神圣Nvidia H100 GPU比较,NorthPole的芯片能效进步了五倍,成为名副其实是何方现在国际最强的AI芯片。

如此逆天的世界上最神圣功效 ,但在国内 ,芯片关于这款芯片的何方新闻却屈指可数  。那么 ,世界上最神圣它究竟是芯片何方神圣 ?

把脑子装进芯片,就行了?

首要 ,何方IBM的“北极”NorthPole是一品种脑芯片,咱们需求先了解什么是。类脑芯片。 。

所谓类脑芯片,望文生义,便是一种高度仿照人脑核算原理的芯片,依据对现代神经科学的了解,重复考虑怎样从晶体管到架构计划 ,算法以及软件来仿照人脑的运算。要是把类脑芯片做得更像人脑,就会被赋予一个新的姓名——。神经形状核算(Neuromorphic Computing)。 。

人类的考虑方法与现在传统的芯片存在许多差异 ,例如 ,人没有独自的存储器,没有动态随机存取存储器,没有哈希层级结构 ,没有同享存储器等等 。

“存储”和“处理器”扑朔迷离地深绕在人脑里 ,在人脑的结构中有“神经元”的存在。在电脑中,以数字化中心彼此沟通依据事情的信息  ,叫做脉冲,这点和人脑传递信息的方法类似。

人类便从人脑中得到创意 ,然后创造出这样的芯片 ,来进步功效 ,成为真实的“人工智能”,乃至无限挨近人类,获得考虑才干。

当然,人脑很杂乱 ,并且人们所制作出来的IC器材,也存在优势  ,因此人们最终目标便是把这二者的优势交融起来  。

总而言之 ,用人话来解说 ,类脑芯片 ,便是结合生物大脑和人工器材各自长处而计划制作出来的一种芯片 ,而它也会像人一起考虑,自我学习。


想造一颗这样的芯片,可不是光变器材结构就行的,而是从资料、器材、电路、架构带动算法和运用改动的 。一言蔽之,便是调集各种最先进的技术,才干造出这样的芯片 。

尽管完成途径许多,但怎样办这种芯片技术难度太大了 ,且不说好不好造 ,计划出来就很难了,因此现在也在开辟阶段,都还无法到达商业化水平 。

但笔者了解到 ,之因此类脑芯片还未构成大计划商业化,一是因此计划难题依存 。  ,就拿英特尔、IBM都看好的CMOS型,多块全数字异步计划的芯片互联 、芯片衔接的有效性和时效性以及软件层互连核算、散布式核算和灵敏分区等问题都难以处理;二是制作 、软件和生态都要彻底推翻,尽管硅基晶体管道路部分可复用,但底层不或许彻底照搬 ,这就进一步加重大计划商业化难度。

那,咱们为啥费大力气折腾类脑芯片?

类脑芯片实在太香了,笔者了解到 ,某些情况下,完美的神经形状芯片能够用比传统处理方案低1000倍的能耗来处理问题,这意味着咱们能够在固定的功耗预算下,打包更多的芯片来处理更大计划的问题。

类脑芯片的超高能效比满足让咱们牟足力气研讨和打破。拿一个最典型的例如来看 ,AlphaGo下棋打败了人类,但人类仅仅是用了20瓦的大脑能耗 ,而AlphaGo是2万瓦。


神经形状芯片触及的范畴和机遇 ,图源丨Nature Computational Science。

结构上 ,现在全国际的类脑芯片根本都一起 ,都是由神经元核算 、突触权重存储、路由通讯三部分构成 ,一起选用与脉冲神经网络(SNN)模型。

但依据资料 、器材、电路,分为仿照电路主导的神经形状体系(数模混合CMOS型)、全数字电路神经体系(数字CMOS型)、依据新式器材的数模混合神经形状体系(忆阻器是候选技术)三种门户 。

全球范围内,参加神经形状核算芯片开发的组织首要包括三类 :英特尔 、IBM 、高通等为代表的科技巨子企业 ,斯坦福、清华为代表的高校/研讨组织以及草创企业。

依据笔者之前与英特尔研讨院对话中得悉 ,数字CMOS型是现在最易产业化的方法,一方面 ,技术和制作成熟度高,另一方面 ,不存在仿照电路的一点儿顾忌和约束  。。

当然,需求着重的是 ,数字CMOS型还仅仅是是最初阶的类脑芯片 ,还算不上彻底仿照人脑的神经形状器材 ,仅仅是能算是一种学习神经形状理念的一种芯片。但光是学习人脑,这种芯片就能够碾压国际上全部一种芯片  。IBM的NorthPole便是这样的数字CMOS型的类脑芯片 。


类脑芯片首要类型和研发发展 ,制表丨电子工程国际 。

IBM的芯片,什么水平 ?

先说定论,应该是。迄今为止,人类水平最高的类脑芯片了,关于类脑芯片研讨又上了一个台阶。 。

2008年,IBM就最初研讨类脑核算了,2011年有了第一次打破性效果:IBM的第一代神经突触核算机芯片。研讨人员制作出两个这样的芯片模型:一颗包括262,144个可编程突触,一颗则包括65,536个可学习突触 ,通过测验展现其可履行导航 、机器视觉  、模式辨认、相关回忆和分类等简略成效 。

直到2014年,IBM在《科学》杂志宣布了一篇文章,向全国际展现了划时代的技术发展 :一个契合DARPA SyNAPSE项目目标的 、具有100万神经元的类脑处理器 ,即TureNorth ,在其时掀起了类脑芯片研讨热潮。

沉寂8年 ,“北极”(NorthPole)面世 ,NorthPole便是建立在IBM最终一颗类脑芯片TrueNorth根底之上,彼时TrueNorth就有这比传统微处理器低四个数量级的能效比,比照一下二者 ,就能很直观感遭到IBM技术的改动 :

  • 单个TrueNorth芯片包括4096个核算中心,能够完成神经突触和神经元摆放的动态映射。IBM TrueNorth体系的一个吸引人的成效是,单个芯片由54亿个晶体管组成 ,仅耗费70mW的功率密度 ,仅占传统核算单元的1/10000;

  • NorthPole选用12nm节点工艺制作,在800平方毫米内集成了220亿个晶体管 ,有256个内核 ,在8位精度下,每个内核每个周期可履行2048次运算;在4位和2位精度下  ,运算次数有或许别离增加一倍和四倍  。运转依据人工智能驱动的图画辨认算法速度是现在市场上同类芯片的22倍  ,能效是同类芯片的25倍。在不运用最先进工艺的情况下 ,NorthPole芯片能耗是运用最先进技术的人工智能芯片的1/5 。整体而言 ,NorthPole的速度大约是TrueNorth的4000倍  。


图/IBM 。

结构方面 ,NorthPole与TrueNorth一起 ,由一个大型核算单元阵列(16×16)组成,每个单元都包括本地内存和代码履行才干 。

核算资源方面,NorthPole每个单元都通过优化,可履行精度较低的核算  ,精度从 2 bit到8 bit 不等 。为确保履行单元运用 ,它们不能依据变量值履行条件分支 ,也便是说 ,运用者代码不能包括if句子。这种简略的履行方法使每个核算单元都能进行大计划并行履行 。在2 bit精度下 ,每个单元可并行履行8000屡次核算。

存储方面,一切的内存都被封装在一颗芯片内, 这意味着每个内核都能够轻松地拜访芯片上的内存 。设备外部来看 ,NorthPole看起来像是一个主动存储芯片,这有助于将NorthPole集成到体系中  。

不止如此 ,这款NorthPole现在选用的是12nm纳米节点工艺制作,现在CPU最先进的技术是3nm ,而IBM还在研发2nm纳米节点技术 ,要是用上2nm,或许IBM的类脑芯片功效还会再进步很大层次。


图/IBM 。

NorthPole的潜在运用首要包括图画和视频剖析、语音辨认以及Transformer神经网络,这些网络是为ChatGPT等谈天机器人供给支撑的大型言语模型(LLM) 。这些人工智能使命或许会用于主动驾驶轿车、机器人 、数字助理和卫星观测等范畴 。

某些运用程序需求的神经网络太大,无法安装在单个NorthPole芯片上 。在这种情况下 ,这些网络能够分解为更小的部分,并散布在多个NorthPole芯片上。

而NorthPole的超高能效比 ,意味着它不需求粗笨的液体冷却体系来运转,电扇和散热器就满足了 ,而它也能够布置在更小的空间中。

国内最初研讨类脑芯片了吗?

如此强壮的芯片 ,国内也早已有所布局 。

国内研讨则包括清华大学、浙江大学、复旦大学、中科院等尖端学府和组织,一起近两年不断涌现草创公司,如灵汐科技 、时识科技、中科神经形状等。其间以清华大学的天机芯和浙江大学的达尔文芯片最具代表性。


详细而言,国内的首要效果包括:

  • 清华大学2015年开发的第一代天机芯选用110nm工艺 ,2017年 ,第二代天机芯最初获得先进效果 ,依据28nm工艺制成 ,由156个成效中心FCore组成 ,包括约4万个神经元和1000万个突触。比较第一代,密度进步20%,速度进步至少10倍,带宽进步至少100倍 ,此外,清华大学还自主研发了软件东西链,支撑从深度学习框架到天机芯的主动映射和编译 。依据清华大学的方案,下一代天机芯将是14nm或更先进的工艺,且成效会强壮更多;

  • 浙江大学联合之江实验室一起研发的类脑核算机 ,其神经元数量与小鼠大脑神经元数量计划适当。该核算机包括792颗达尔文2代芯片,支撑1.2亿个脉冲神经元、720亿个神经突触 ,而其典型运转功耗仅为350W~500W;

  • 2020年10月 ,清华大学核算机系张悠慧团队精仪系施路平团队与合作者在《天然》(Nature)杂志发文初次提出“类脑核算齐备性”以及软硬件去耦合的类脑核算体系层次结构;

  • 2023年9月,我国科学院核算技术研讨所尤海航研讨员和唐光亮研讨员带领的研讨团队研发了超导神经形状处理器原型芯片“苏轼(SUSHI)” ,它是一款依据超导单磁通量子(SFQ)电路的超导核算芯片;

  • 2023年10月,由中科南京智能技术研讨院自主研发是现在国内计划最大 、国际一流的类脑超级核算机服务正式启用 ,它已完成5亿神经元2500亿突触智能计划  ,较现有核算体系能效进步10倍以上 ,中心芯片自主可控。

IBM的效果代表着,这项布局未来的技术离咱们又近了一步,而现在一点儿草创公司逐渐构成方案 ,最初运用 。不难预可可见 ,在近几年  ,这项技术商业化将逐渐打开 ,而彼时研讨效果也将照进实际 。

参照文献。

[1] IBM:A new chip architecture points to faster , more energy-efficient AI.https://research.ibm.com/blog/northpole-ibm-ai-chip。

[2] IEEE Spectrum:IBM Debuts Brain-Inspired Chip For Speedy, Efficient AI.2023.10.23.https://spectrum.ieee.org/neuromorphic-computing-ibm-northpole 。

[3] Schuman C D, Kulkarni S R, Parsa M , et al. Opportunities for neuromorphic computing algorithms and applications[J]. Nature Computational Science , 2022 , 2(1): 10-19.https://doi.org/10.1038/s43588-021-00184-y 。

[4] 清华大学:清华大学核算机系张悠慧团队初次提出“类脑核算齐备性”.2020.10.16.https://mp.weixin.qq.com/s/-zZpk1pESZ_q2eDWECsIZg  。

[5] 中科院核算所 :核算所研发超导神经形状处理器原型芯片“苏轼(SUSHI)”.2023.9.28.https://mp.weixin.qq.com/s/kUz6hYkI7hvs9a09pDtwhw 。

[6] 南京发布:问天Ⅰ,类脑核算机.2023.10.17.https://mp.weixin.qq.com/s/Mm-Tb-Vrr-uXXu4uKZe9sA  。

本文来自微信大众号:电子工程国际(ID :EEworldbbs),作者:付斌。

本内容为作者独立观念,不代表虎嗅态度 。未经答应不得转载 ,授权事宜请联络 hezuohuxiu.com 。

正在改动与想要改动国际的人 ,都在 虎嗅APP。


友情链接
联系我们

地址:台安

电话:0781-986390

传真:0793-986229

邮箱:changningqu2580@163.com

0.1546

Copyright © 2023 Powered by 1316岁macbookpro-知乎精选  sitemap