加入收藏 | 设为首页 | 会员中心 | 我要投稿 PHP编程网 - 黄冈站长网 (http://www.0713zz.com/)- 数据应用、建站、人体识别、智能机器人、语音技术!
当前位置: 首页 > 运营中心 > 产品 > 正文

600亿晶体管突破7nm极限!全球首个3D晶圆级封装IPU诞生

发布时间:2022-03-05 08:44:00 所属栏目:产品 来源:互联网
导读:总部位于英国的AI芯片公司Graphcore发布了新一代IPU产品Bow,这是其第三代IPU系统,发布即面向客户发货。 与上一代IPU相比,Bow IPU性能提升40% ,能耗比提升了16%,电源效率也提升16%。 新一代 IPU 性能提升40%,价格保持不变 2016年,Graphcore成立并开
  总部位于英国的AI芯片公司Graphcore发布了新一代IPU产品Bow,这是其第三代IPU系统,发布即面向客户发货。
 
  与上一代IPU相比,Bow IPU性能提升40% ,能耗比提升了16%,电源效率也提升16%。
 
  
  新一代 IPU 性能提升40%,价格保持不变
 
  2016年,Graphcore成立并开创了全新类型处理器架构IPU,因其在架构上的创新曾被英国半导体之父Hermann Hauser称之为是计算机历史上的第三次革命。
 
  经历6年时间的发展,Graphcore的IPU逐渐在在金融、医疗、电信、机器人、云和互联网等领域取得成效。本周四,Graphcore又推出了第三代产品Bow IPU。
 
  据Graphcore介绍,第三代IPU相对于上一代M2000,性能提高40%,每瓦性能提升16%,即能耗比实现16%的提升。
 
  不过,AI芯片的真实性能还需要放在不同的应用领域中讨论。为此,Graphcore也给出了在不同垂直领域中Bow的性能表现。
  
  在图像方面,无论是典型的CNN网络,还是近期比较热门的Vision Transformer网络,以及深层次的文本到图片的网络,与上一代产品相比,Bow IPU都有30%到40%的性能提升,在EfficientNet-B4这一项中,接近理论上限值。
 
  BERT训练模型是自然语言方面的经典模型,基于BERT,OpenAI提出了GPT-1、GPT-2、GPT-3等纵向扩展或横向扩展,通过更深的网络层次和更宽的网络宽度让模型的性能和精度进一步提高。
 
  
  不仅如此,转换到实际模型中的吞吐量,与IPU POD64相比,在计算机视觉的ResNet50 和 EifficientNet-B4 训练模型中,Bow Pod64的吞吐量能够达到34%和39%的性能提升。
  
  作为英伟达的竞争对手,Graphcore自然不忘将 Bow Pod16 与DGX-A100进行对比,实验数据表明,EfficientNet-B4的backbone的训练在DGX-A100上需要花费70个小时的训练时间,而在Bow Pod16上,只需要14小时左右。
 
  接近理论极限的性能提升,Graphcore Bow IPU是如何实现的?
 
  5nm不再是首选,采用先进封装性价比更高
 
  从芯片的规格上看,Bow IPU是世界上第一款基于台积电的 3D Wafer-On-Wafer的处理器,单个封装中拥有超过600亿个晶体管,具有350 TeraFLOPS的人工智能计算的性能,是上一代MK2 IPU的1.4倍。
 
  片内存储较上一代来看没有变化,依然保持0.9GB的容量,不过吞吐量从47.5TB提高到了65TB。
 
  
  “变化主要体现在,它是一个3D封装的处理器,晶体管的规模有所增加,算力和吞吐量均得到提升。” Graphcore大中华区总裁兼全球首席营收官卢涛说道。而在大家都关注的工艺制程上,Bow IPU 延续了上一代台积电 7nm 工艺制程,没有变化。
 
  理论上,一颗芯片的性能提升很大程度上取决于工艺制程上的进步,但随着工艺制程越来越逼近物理极限,摩尔定律逐渐失效,业界不得不寻找新的技术方向来延续摩尔定律。其中,3D封装就是被业界广泛看好的技术方向。
 
  中国工程院院士、浙江大学微纳电子学院院长吴汉明就曾在一次演讲中提到,如果将芯片制造和芯片封装相结合,也可以做到65nm工艺制程实现40nm工艺制程的性能功耗要求。

(编辑:PHP编程网 - 黄冈站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读